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内 容 提 要 


本 书 讲述 了 Linux 系 统 及 其 他 UNIX 风 格 的 操作 系统 上 的 程序 开发 ， 
主要 内 容 包括 标准 Linux C 语 言 水 数 库 和 由 不 同 的 Linux 或 UNIX 标 准 指 定 
的 各 种 工具 的 使 用 方法 ， 大 多 数 标准 Linux 开 发 工具 的 使 用 方法 ， 通 过 
DBM 和 和 MySQL 数据 库 系 统 存储 Linux 中 的 数据 ， 为 X 视 窗 系统 建立 图 形 
化 用 户 界 面 等 。 本 书 通过 先 介 绍 程序 设计 理论 ， 再 以 适当 的 例子 和 清晰 
的 解释 来 前 明 它 的 方式 ， 帮助 读者 迅速 掌握 相关 的 知识 

本 书 适 合 Linux 的 初学 者 及 和 希望 利用 Linux 进 行 开 发 的 程序 人 员 阅 
读 ， 也 适合 作为 高 等 院 校 计 算 机 相关 专业 师 生 的 参考 教材 。 
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所 有 的 计算 机 程序 员 都 会 随手 记 下 大 量 笔 记 ， 其 中 的 代码 示例 往往 
来 自前 人 对 使 用 手册 的 深入 钻研 ， 或 者 来 自 Usenet 新 闻 组 ， 来 自 后 者 的 
代码 有 时 连 最 盲目 的 探索 者 也 不 敢 照 搬 照 抄 〈 当 然 也 有 男 一 种 观点 认 
为 ， 他 们 都 可 以 自由 地 访问 Usenet 新 闻 组 ， 并 且 从 来 没有 停止 过 对 其 中 
代码 的 使 用 ) ， 但 采用 这 种 风格 的 图 书 可 以 说 少 之 又 少 ， 这 不 能 不 说 是 
一 件 很 奇怪 的 事情 。 在 因特网 中 ， 存 在 着 大 量 针对 程序 设计 和 系统 管理 
特定 领域 的 、 短 小 精 悍 而 又 切中 问题 关键 的 文档 。Linux 文 档 项 目 发 表 
了 一 系列 的 文档 ， 内 容 涵盖 了 Linux 的 各 个 方面 ， 从 在 同一 台 机 器 上 同 
时 安装 Linuxz 和 Windows 到 将 你 的 咖啡 机 连接 到 Linux 系 统 。 你 可 以 通过 
网 址 http://www.tldp.org 来 查看 Linux 文 档 项 目 。 

从 男 一 方面 来 看 ， 现 在 的 图 书市 场 充斥 着 大 量 这 样 的 图 书 ， 它 们 要 
么 是 大 部 头 的 巨著 ， 内 容 详尽 而 全 面 ， 使 得 你 没有 时 间 把 它们 读 完 ， 要 
么 就 是 完全 面向 初学 者 的 入 门 图 书 ， 你 购买 它们 只 是 为 了 送 给 朋友 “〈 开 
个 玩笑 而 已 )。 只 有 很 少 的 书籍 尝试 着 对 大 量 实际 应 用 领域 的 基本 概念 
和 做 法 进行 介绍 。 本 书 就 是 其 中 之 一 ， 它 是 对 程序 员 笔 记 的 摘要 ， 经 过 
eerie gag etree 
os 


本 书 这 一 版 经 过 了 审阅 和 和 更新， 反映 了 目前 Linux 开 发 的 现状 。 


Alan Cox 
Linux 内 核 维护 者 
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欢迎 阅读 本 书 第 4 版 ， 这 是 一 本 针对 在 Linux 系 统 和 其 他 UNIX 风 格 
的 操作 系统 上 进行 程序 开发 的 易于 使 用 的 指南 性 读物 。 

在 本 书 中 ， 我 们 的 目标 是 介绍 对 于 Linux 程 序 员 来 说 非常 重要 的 主 
题 ， 这 些 主题 的 涵盖 面 非 常 广泛 。 书 名 中 的 “beginning” 更 多 的 是 指 书 中 
的 内 容 而 不 是 读者 的 技能 。 我 们 对 本 书 的 内 容 组 织 进行 了 精心 的 安排 ， 
以 帮助 读者 更 多 地 了 解 Linux 所 提供 的 功能 ， 而 不 管 读者 现 有 的 经 验 有 
多 少 。Linux 程 序 设计 是 一 个 很 大 的 领域 ， 我 们 的 目标 是 对 广泛 领域 中 
的 大 量 主题 都 进行 介绍 ， 从 而 让 读者 在 每 个 主题 上 都 具备 足够 的 入 门 知 


VAs 


读者 对 象 


如 果 你 是 一 位 程序 员 ， 和 希望 利用 Linux (BKUNIX) 提供 给 软件 开发 
者 的 工具 来 加 快 程序 开发 的 进度 ， 尽 量 减 少 编程 时 间 并 让 你 的 程序 充分 
利用 Linux 系 统 所 提供 的 功能 ， 那 么 本 书 将 非常 适合 你 。 书 中 明确 清晰 
的 解释 和 分 步骤 的 实验 ， 将 帮助 你 迅速 提高 编程 能 力 和 和 掌握 所 有 的 关键 


技术 。 

我 们 假设 读者 具备 一 些 C 或 C++ 语言 的 编程 经 验 ， 这 些 经 验 可 能 3 
自 Windows 系 统 或 其 他 一 些 操 作 系统 。 但 我 们 会 尽量 保持 书 中 示例 程序 
的 简单 ， 即 便 你 不 是 一 个 C 语 言 编程 专家 ， 也 可 以 轻松 地 阅读 本 书 。 如 
A a a a 
E 引出 。 


如 果 你 刚 开 始 学 习 Linux， 请 注意 ， 这 不 是 一 本 介绍 Linux 安 
装 和 配置 的 图 书 。 如 果 你 想 多 学 习 一 些 Linux 系 统管 理 方面 的 知 
识 ， 请 阅读 其 他 的 参考 书籍 ， 如 Christopher Negus 的 Linux Bible 
2007 Edition Wiley, ISBN 978-0470082799) . 


本 书 的 目标 是 作为 一 本 教程 ， 向 读者 介绍 大 多 数 Linux 系 统 上 都 有 
的 各 种 工具 和 函数 /函数 库 集 ， 同 时 本 书 也 可 以 作为 一 本 方便 使 用 的 参 
EFH KAPKE RERED WA Z mR. 


主要 内 容 


本 书 希 望 让 你 达到 以 下 几 个 学 习 目 标 。 

O 掌握 标准 Linuix C 语 言 函 数 库 和 由 各 种 Linux 或 UNIX 标 准 指 定 的 

其 他 工具 的 使 用 方法 。 

O 掌握 如 何 使 用 大 多 数 标 准 Linux 开 发 工具 。 

口 “ 学 会 通过 DBM 和 MYySQL 数 据 库 系 统 存储 Linux 中 的 数据 。 

O 理解 如 何 为 X 视 窗 系统 建立 图 形 用 户 界 面 。 我 们 将 同时 使 用 

GTK (GNOME 环 境 的 基础 ) 和 Qt (KDE 环 境 的 基础 ) 函数 库 。 

口 拥有 开发 自己 的 实际 应 用 程序 的 信心 和 能 力 。 

在 讨论 这 些 主题 时 ， 我 们 首先 介绍 编程 理论 ， 然 后 通过 适当 的 例子 
和 清晰 的 解释 来 曾 明 它 。 通 过 这 种 方式 ， 你 可 以 在 第 一 遍 的 学 习 中 就 能 
ee Ee Sener Oe meee 
FES ELIA oO 

书 中 小 示例 程序 主要 是 为 了 演示 一 组 函数 的 用 法 或 某 些 新 概念 的 实 
际 使 用 情况 。 贯 穿 全 书 有 一 个 大 型 的 示例 项 目 : 一 个 简单 的 用 于 记录 音 
乐 CD 详细 资料 的 数据 库 应 用 程序 。 随 着 知识 面 的 扩展 ， 你 可 以 按照 自 
己 的 意愿 开发 、 重 新 实现 和 扩展 这 个 项 目 。 虽 然 如 此 ， 这 个 CD 应 用 程 
序 对 本 书 的 任何 一 章 来 说 都 不 是 必需 的 ， 所 以 只 要 你 愿意 也 可 以 忽略 
它 ， 但 我 们 认为 它 对 书 中 讨论 的 技术 提供 了 一 些 有 用 的 和 深入 的 示范 ， 
并 且 它 还 有 助 于 讲解 每 个 高 级 主题 。 我 们 对 这 个 应 用 程序 的 第 一 次 讨论 
出 现在 本 书 第 2 章 的 结尾 处 ， 它 显示 了 一 个 非常 大 的 shell 脚 本 是 如 何 组 
ee en nae S A eee 

在 简要 介绍 完 编译 程序 、 链 接 函 数 库 和 访问 在 线 手 册 的 基本 概念 
后 ， 将 全 面 介绍 shell 编 程 。 然 后 你 将 投入 到 C 语 言 程序 设计 中 ， 我 们 在 
这 里 讨论 的 内 容 包 括 文件 操作 、 从 Linux 环 境 中 获取 信息 、 处 理 终端 的 
输入 输出 和 curses 函 数 库 〈 它 使 得 交互 式 的 输入 和 输出 更 易于 管理 ) 。 
最 后 你 将 用 C 语 言 重 新 实现 CD 应 用 程序 。 应 用 程序 的 设计 方法 没有 变 
化 ， 但 新 的 代码 中 将 用 curses 函 数 库 提供 一 个 基于 屏幕 的 用 户 界面 。 

接 下 来 我 们 讨论 数据 管理 。 为 了 学 习 dbm 数 据 库 函数 库 的 使 用 方 
法 ， 我 们 将 再 次 重新 实现 这 个 应 用 程序 ， 但 这 次 实现 所 采用 的 设计 方法 
将 贯穿 本 书后 续 的 一 些 章节 。 在 其 后 的 一 章 中 ， 我 们 将 介绍 数据 是 如 何 


使 用 MySQL 存 储 在 一 个 关系 数据 库 中 的 ， 并 且 我 们 还 将 在 该 章 的 稍 后 
部 分 重新 使 用 这 种 数据 存储 技术 ， 以 便 读 者 了 解 两 种 技术 的 区 别 。 随 着 
这 些 应 用 程序 的 规模 越 来 越 大 ， 我 们 接 下 来 需要 介绍 调试 、 源 代码 控 
制 、 软 件 发 行 和 makefile 文 件 等 具体 内 容 。 

接 下 来 ， 你 将 看 到 不 同 的 Linux 进 程 是 如 何 使 用 各 种 技术 进行 通信 
的 ， 以 及 Linux 程 序 是 如 何 使 用 套 接 字 来 支持 不 同 机 堪 之 间 的 TCP/P 网 
络 通信 的 ， 包 括 与 使 用 不 同 处 理 器 架构 的 机 器 之 间 通 信 的 问题 。 

在 掌握 了 Linux 程 序 设计 的 基础 之 后 ， 我 们 开始 讨论 图 形 化 程序 的 
创建 方法 。 我 们 将 通过 两 章 的 篇 幅 来 介绍 相关 内 容 。 首 先 介 绍 GTK+ 工 
具 包 ， 它 是 GNOME 开 发 环境 的 基础 ， 然 后 介绍 Qt 工具 包 ， 它 是 KDE 开 
发 环境 的 基础 。 

在 本 书 的 最 后 一 章 ， 我 们 简要 介绍 了 Linux 的 标准 ， 正 是 这 些 标准 
使 得 不 同 厂 商 的 Linux 发 行 版 保持 了 足够 的 相似 性 ， 从 而 使 我 们 编写 的 
程序 可 以 在 不 同 的 Linux 发 行 版 上 运行 。 

正如 你 所 期 望 的 ， 本 书 还 包括 许多 其 他 内 容 ， 但 我 们 希望 这 里 给 出 
的 简单 介绍 能 够 让 你 对 将 讨论 的 内 容 有 一 个 清晰 的 概念 。 


准备 工作 


在 本 书 中 ， 我 们 将 给 予 读 者 一 种 Linux 程 序 设计 的 体验 。 为 了 更 好 
地 理解 各 章 的 内 容 ， 你 应 该 在 阅读 本 书 时 ， 实 际 运行 书 中 的 程序 示例 。 
这 将 提供 一 个 很 好 的 编程 实践 体验 ， 并 将 启发 你 创建 自己 的 程序 。 我 们 
希望 读者 一 边 阅 读 一 边 在 Linux 系 统 上 实际 操作 。 

Linux 可 以 用 在 许多 不 同 的 系统 上 。 其 适应 性 使 得 只 要 设备 中 有 一 
个 处 理 器 芒 片 ，Linux 就 可 以 以 这 样 或 那样 的 方式 在 其 上 运行 。 可 以 运 
行 Linux 系 统 的 设备 包括 基于 Alpha、ARM.、 IBM Cell, Itanium, PA- 
RISC、Power PC、SPARC、SuperH、68k 以 及 各 种 X86 系列 处 理 器 (32 
位 和 64 位 ) 的 计算 机 。 

我 们 使 用 两 台 不 同 配置 的 Linux 系 统 来 编写 本 书 并 开发 书 中 的 程序 
示例 ， 所 以 我 们 可 以 确信 ， 只 要 你 的 机 器 可 以 运行 Linux， 你 就 可 以 很 
好 的 利用 本 书 。 此 外 ， 在 本 书 的 技术 审核 阶段 ， 我 们 还 在 其 他 版 本 的 
Linux 系 统 中 测试 了 书 中 的 全 部 代码 。 

我 们 在 编写 本 书 时 主要 使 用 的 是 基于 x86 的 系统 ， 但 我 们 所 讨论 的 
内 容 很 少 是 只 适用 于 x86 的 。 虽 然 在 一 台 有 8MB 内 存 的 486 机 器 上 运行 
Linux 也 是 可 能 的 ， 但 要 想 成 功 地 运行 一 个 现代 Linux 发 行 版 并 运行 本 书 
中 的 程序 示例 ， 我 们 建议 你 使 用 Fedora、openSUSE 或 Ubuntu 等 比较 流行 
的 Linux 发 行 版 的 最 新 版 本 ， 并 采用 它们 所 推荐 的 硬件 配置 。 


在 软件 需求 方面 ， 我 们 建议 使 用 你 偏爱 的 Linux 发 行 厂 的 最 新 版 
本 ， 并 应 用 当前 更 新 《大 多 数 广 商 会 通过 自动 更 新 的 方式 在 线 提供 这 些 
更 新 〉 以 保证 你 的 系统 打上 了 所 有 的 补丁 。Linux 和 GNU 工 具 集 都 是 以 
GNU 通 用 公共 许可 证 (GPL) 的 形式 发 布 的 。 一 个 典型 的 Linux 发 行 版 
的 大 多 数 其 他 组 件 也 都 使 用 GPL 许 可 证 或 其 他 开放 源码 许可 证 之 一 ， 这 
意味 着 它们 都 具有 某 些 特性 ， 其 中 之 一 就 是 自由 。 它 们 的 源 代 码 总 是 可 
以 被 自由 获取 ， 没 有 人 可 以 剥夺 这 种 自由 。 关 于 GPL 的 详细 资料 请 见 
http: //www.gnu.org/licenses/。 关 于 开放 源码 定义 和 它 所 使 用 的 各 种 许 
可 证 的 详细 资料 请 见 http://www.open-source.org/。 你 总 是 可 以 获取 到 对 


GNU/Linux 的 文 持 一 一 你 可 以 目 己 研究 源 人 代码、 雇用 他 人 或 购买 广 商 的 
付费 文 持 。 
源 代码 


当 试 验 本 书 中 的 程序 示例 时 ， 你 可 以 手工 输入 所 有 的 代码 ， 也 可 以 
使 用 和 本 书 配 套 的 源 代码 文件 。 本 书 使 用 的 所 有 程序 源 代码 都 可 以 从 
http://Wwww.wrox.com 上 下 载 。 在 该 网 站 中 ， 你 只 需 找到 本 书 所 在 页 面 
(通过 搜索 框 或 使 用 书 名 列表 )〉 ， 然 后 在 本 书 内 容 介 绍 页 面 点 击 
Download Code CFRE) 链接 ， 就 可 以 获得 本 书 的 所 有 源 代码 了 。 


因为 很 多 图 书 都 有 类 似 的 书 名 ， 所 以 通过 ISBN 搜 索 图 书 是 最 
佳 的 方式 。 本 书 的 ISBN 为 978-0-470-14762-7。 


在 下 载 了 源 代 码 之 后 ， 你 就 可 以 用 压缩 工具 对 其 解压 。 此 外 ， 你 也 
可 以 访问 Wrox 代 人 码 下 载 主页 
(http: //www.wrox.com/dynamic/books/download.aspx) ， 获 取 本 书 和 
其 他 Wrox 图 书 的 源 代码 。 


代码 下 载 说 明 


我 们 尽力 癌 读 者 提供 能 够 清晰 闻 明 书 中 押 讨 论 概 念 的 示例 程序 和 代 
码 片 段 。 需 要 指出 的 是 ， 为 了 尽 可 能 地 解释 清楚 书 中 介绍 的 新 功能 ， 我 
们 将 采用 一 种 或 两 种 代码 风格 。 

特别 要 指出 的 是 ， 我 们 并 没有 对 调用 的 每 个 函数 的 返回 值 进行 检 
碍 ， 以 判断 它 是 否 与 我 们 预期 的 一 样 。 在 真正 的 应 用 程序 代码 中 ， 我 们 
肯定 要 做 这 样 的 检查 工作 ， 而 读者 也 应 该 对 错误 处 理 采取 严格 的 措施 。 
(本 书 的 第 3 章 将 讨论 一 些 捕 获 和 处 理 错误 的 方法 。) 


GNU 通 用 公共 许可 证 


书 中 的 所 有 源 代码 都 遵循 GNU 通 用 公共 许可 证 第 二 
(http://www.gnu.org/licenses/old-licenses/ gpl-2.0.html) 的 条 款 。 下 面 的 
许可 说 明 适 用 于 本 书 所 有 的 源 代码 : 


istribute it and/or modify 


This program is free s 
i 


it under the terms of the GNU General Public License as published by 
the Free Software Foundation; either version 2 of the License, or 
option) any later version. 
` 
排版 约定 
一 


为 了 帮助 读者 更 好 地 理解 本 书 内 容 ， 随 时 把 握 学 习 重 点 ， 全 书 将 使 
用 以 下 一 些 排版 约定 : 


书 中 像 这 样 的 文字 框 中 记录 的 是 一 些 重要 的 、 不 应 该 被 未 记 
的 、 非 常 天 键 的 信息 。 它 们 与 周边 的 内 容 直 接 相 关 。 


对 当前 讨论 内 容 的 技巧 、 提 示 、 罕 门 和 旁白 都 会 像 这 样 缩 进 
放置 并 将 字体 设置 为 楷体 。 
当 我 们 进行 介绍 时 ， 我 们 将 把 一 些 重要 的 单词 用 楷体 印刷 ， 需 要 读 


者 输入 的 字符 用 粗 体 印刷 。 组 合 键 的 格式 为 : Ctrl+A。 
我 们 使 用 3 种 不 同 的 方式 来 印刷 代码 和 终端 会 话 : 


3 who 
root ttyl Sep 10 16:12 
Frick tty2 Sep 10 16:10 


对 于 命令 行 ， 它 的 样式 如 上 面 代码 的 项 部 所 示 ， 而 它 的 输出 结果 则 
以 常规 风格 印刷 。 字 符 $ 是 提示 符 《〈 如 果 命 令 需要 超级 用 户 来 执行 ， 则 
提示 符 会 用 字符 # 来 和 葡 代 ) ， 粗 体 字 的 文本 是 需要 读者 输入 的 命令 ， 然 
后 按 下 回 车 键 执 行 该 命令 。 其 后 采用 相同 字体 但 不 是 黑体 的 所 有 文本 痢 


征 该 黑体 字 命令 的 输出 。 在 上 面 的 例子 中 ， 你 输入 命令 who， 然 后 将 在 
命令 下 面 看 到 输出 的 结果 。 
Linux 定 义 的 函数 和 结构 的 原型 使 用 黑体 字 来 印刷 ， 如 下 所 示 : 


#include <stdio.h> 


int printf (const char *format, ...); 

在 我 们 的 代码 示例 中 ， 融 有 发 纹 的 部 分 是 新 的 、 重 要 的 内 容 ， 如 下 
ARAN: 
/* 这 样 印刷 的 是 新 的 、 重 要 的 代码 。*/ 
而 如 果 代 码 采 用 的 是 如 下 所 示 不 市 底 纹 的 风格 ， 束 表示 它 的 内 容 没 有 奢 
LEH: 


/* 这 样 印刷 的 是 以 前 出 现 过 的 代码 。*/ 
当 程 序 代 码 的 内 容 在 一 章 中 有 增加 时 ， 后 来 添加 的 代码 首次 出 现时 
eee 其 后 融 不 再 加 底 纹 了 。 例 如 ， 一 个 新 的 程序 如 下 
ZN: 
/* 代码 示例 */ 


/* 到 此 结 */ 

如 果 我 们 在 该 章 的 稍 后 部 分 增加 了 这 个 程序 的 内 容 ， 新 增 代 码 将 市 
有 底 纹 : 
/* 代码 示例 */ 
/* 这 一 行 和 下 一 行 */ 
/* 是 新 增 的 代码 */ 
/* 到 此 结束 */ 

我 们 要 提 到 的 最 后 一 个 约定 是 ， 我 们 在 每 个 程序 示例 开始 之 前 都 会 
加 上 一 个 “实验 ”标题 ， 其 目的 是 为 了 将 代码 分 隔 开 ， 突 出 显示 其 组 成 部 
分 ， 同 时 可 以 显示 应 用 程序 的 进度 。 当 我 们 觉得 有 必要 时 ， 还 会 在 代码 
之 后 加 上 “实验 解析 ”部 分 ， 来 解释 代码 中 与 前 面 理论 有 关 的 关键 之 处 。 
我 们 发 现 这 两 个 约定 有 助 于 把 非常 难于 理解 的 代码 清单 分 解 为 相对 简单 


的 部 分 。 


勘误 表 


我 们 已 经 尽力 保证 本 书 的 文字 和 程序 代码 没有 任何 错误 。 但 是 人 无 
完 人 ， 错 误 总 是 难免 的 。 如 果 你 找到 了 本 书 中 的 错误 ， 比 如 拼写 错误 或 
代码 错误 ， 我 们 将 非常 感谢 可 以 得 到 你 的 反馈 。 指 正 错误 不 仅 可 以 为 其 
他 读者 节省 时 间 ， 同 时 也 可 以 玫 助 我 们 提高 图 书 的 品质 。 

要 找到 本 书 的 勘误 表 ， 请 访问 http: /www.wrox.com， 然 后 使 用 搜 
索 框 或 书 名 列表 来 找到 本 书 。 在 本 书 的 页 面 ， 点 击 Book Errata (AIH) 
误 表 ) 链接 。 在 该 链接 指 回 的 页 面 中 ， 你 可 以 看 到 由 Wrox 编 辑 发 布 的 
所 有 针对 本 书 提 交 的 勘误 。 你 也 可 以 通过 网 址 
http: /www.wrox.comy/misc-pages/booklist.shtml 找 到 一 个 完整 的 图 书 列 
表 ， 其 中 包括 指向 每 本 书 勘误 表 的 链接 。 

如 果 在 本 书 的 勘误 表 中 没有 找到 你 发 现 的 错误 ， 可 以 访问 网 址 
http: //Wwww.wrox.com/contact/techsupport.shtml， 填 写 该 页 面 上 的 表格 以 
将 你 发 现 的 错误 发 送 给 我 们 。 我 们 将 检查 你 发 送 过 来 的 信息 ， 如 果 它 是 
正确 的 ， 我 们 将 在 本 书 的 勘误 表 中 发 布 该 信息 ， 并 在 本 书 的 下 一 版 中 修 


正 该 问题 。 


p2p.wrox.com 


为 参与 作者 和 同行 的 讨论 ， 你 可 以 加 入 P2P 论 坛 ， 它 的 网 址 是 
p2p.wrox.com。 这 个 论坛 是 一 个 基于 Web 的 系统 ， 你 可 以 在 其 上 发 布 与 
Wrox 图 书 和 相关 技术 有 关 的 消息 ， 并 与 其 他 读者 和 技术 用 户 交 流 。 这 
个 论坛 还 提供 了 订阅 功能 ， 当 有 你 感 兴趣 的 主题 发 布 时 ， 论 坛 会 通过 电 
子 邮件 把 这 些 消 息 发 送 给 你 。 Wrox 的 作者 、 编 辑 、 其 他 行业 专家 和 与 
你 一 样 的 读者 都 会 到 这 个 论坛 探讨 一 些 问题 。 

在 http: /p2p.wrox.com 中 ， 你 将 找到 很 多 不 同 的 论坛 ， 这 些 论坛 不 
仅 有 助 于 你 疝 读 本 书 ， 而 且 也 有 助 于 你 开发 自己 的 应 用 程序 。 要 加 入 这 
些 论坛 ， 你 只 需 按 如 下 步骤 操作 即 可 。 

(1) 访问 p2p.wrox.com 并 点 击 Register 链 接 。 

(2) 阅读 使 用 条 天 并 点 击 Agree 按 钮 。 

(3) 填写 加 入 论坛 所 必需 的 信息 和 你 想 要 提供 的 其 他 可 选 信息 ， 
然后 点 击 Submit 按 钮 。 

(4) 你 将 收 到 一 封 电子 邮件 ， 该 邮件 告诉 你 如 何 验 证 你 的 账号 并 
完成 加 入 程序 。 


注意 ， 不 加 入 P2P 论 坛 也 可 以 阅读 论坛 中 的 消 妃 ， 但 是 如 果 


WEE ZA ACHE, (ite AUILA rE . 


加 入 论坛 后 ， 你 束 可 以 发 布 新 消息 并 回复 其 他 用 户 发 布 的 消息 了 。 
你 可 以 在 任何 时 间 了 阅读 Web 站 点 上 的 消息 。 如 果 和 希望 某 个 论坛 能 将 最 新 
的 消息 通过 电子 邮件 发 送 给 你 ， 你 可 以 点 击 论坛 列表 中 该 论坛 名 称 劳 边 
的 Subscribe to this For um 图标 。 

要 获得 如 何 使 用 Wrox P2P 的 更 多 信息 ， 你 可 以 阅读 P2P FAQ 列 表 中 
的 问题 及 其 答复 ， 这 些 问题 与 论坛 软件 的 工作 原理 及 很 多 与 P2P 和 Wrox 
SN eee 要 阅读 FAQ， 你 可 以 点 击 任 何 P2P 页 面 上 的 
FAQES o 
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在 本 章 中 ， 你 将 发 现 Linux 是 什么 ， 以 及 它 与 它 的 灵感 之 源 


ae ) 门 


UNIX 有 何 关 系 。 我 们 将 带领 你 了 解 Linux 开 发 系统 提供 了 哪些 机 制 ， 并 


且 编 写 和 运行 你 的 第 一 个 程序 。 在 本 章 中 ， 我 们 将 介绍 以 下 几 方 面 的 内 


F 


W: 
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UNIX、Linux 和 GNU 
Linux 程 序 及 其 编程 语言 
如 何 寻 找 开发 资源 
静态 库 和 共享 库 


UNIX 哲 学 


1.1 UNIX, Linux GNUS 


近年 来 ，Linux 已 成 为 一 种 现象 。 几 乎 每 天 ，Linux 都 以 某 种 方式 出 
现在 媒体 上 。 我 们 已 经 数 不 清 在 Linux 上 有 多 少 应 用 程序 以 及 有 多 少 机 
构 〈 包 括 一 些 政府 部 门 和 城市 管理 部 门 ) 在 使 用 Linux 了。 主要 的 人 硬件 
厂商 (如 IBM 和 Dell〉 现 在 都 已 文 持 Linux， 主 要 的 软件 厂商 (如 
Oracle) 也 都 已 支持 他 们 的 软件 运行 在 Linux 之 上 。Linux 已 真正 成 为 一 
个 切实 可 行 的 操作 系统 ， 特 别 是 在 服务 器 市 场 中 。 

Linux 的 成 功 要 归功 于 在 它 之 前 诞生 的 系统 和 应 用 程序 UNIX 和 
GNU 软 件 。 本 节 将 介绍 Linux 是 怎样 产后 的， 以 及 它 植 根 于 何 处 。 


1.1.1 什么 是 UNIX 


UNIX 操 作 系 统 最 初 是 由 贝尔 实验 室 开 发 的 ， 当 时 的 贝尔 实验 室 是 
电信 业 巨 尖 AT&T (美国 电报 电话 公司 ) 旗下 的 一 员 。UNIX 是 在 20 世 
纪 70 年 代为 DEC (数字 设备 公司 ) 的 PDP 系 列 计算 机 设计 的 ， 它 现在 已 
成 为 一 种 非常 流行 的 多 用 户 、 多 任务 操作 系统 。UNIX 操 作 系 统 可 以 运 
行 在 大 量 不 同 种 类 的 硬件 平台 上 ， 其 适用 范围 从 PC 工作 站 一 直到 多 处 
理 器 服务 器 和 超级 计算 机 。 


1. UNIX 简 史 


严格 来 说 ，UNIX 是 由 Open Group 〈 开 放 组 织 ) 管理 的 一 个 商标 ， 
它 指 的 是 一 种 遵循 特定 规范 的 计算 机 操作 系统 。 这 个 规范 也 称 为 单一 
UNIX 规 范 (The Single UNIX Specification) ， 它 定义 了 所 有 必需 的 
UNIX 操 作 系 统 函数 的 名 称 、 接 口 和 行为 。 这 个 规范 在 很 大 程度 上 是 早 
(电气 和 电子 工程 师 协会 ) 开发 的 P1003 或 POSIX 规 范 的 超 


许多 类 UNIX 系 统 都 是 具有 商业 性 质 的 ， 如 IBM 的 AIX、HP 的 HP- 
UX 和 Sun 的 Solaris。 还 有 一 些 可 以 免费 获得 ， 如 FreeBSD 和 Linux。 如 今 
are ere Ane 从 而 允许 它们 挂 上 “UNIX” 的 
Hat] AVN o 

在 过 去 ， 不 同 UNIX 系 统 之 间 的 兼容 性 一 直 是 一 个 实际 存在 的 问 
题 ， 尽 管 POSIX 规 范 在 这 一 方面 起 了 很 大 的 帮助 。 现 在 ， 通 过 遵守 一 些 
简单 的 规则 ， 创 建 可 以 运行 在 所 有 UNIX 和 类 UNIX 系 统 上 的 应 用 程序 已 
成 为 可 能 。 关 于 Linux 和 UNIX 标 准 的 更 多 细节 内 容 可 以 在 本 书 的 第 18 章 


中 找到 。 
2. UNIX 哲 学 


在 后 续 的 章节 里 ， 我 们 希望 能 够 癌 读 者 传达 一 种 Linux (UNIX) fE 
序 设计 的 风格 。 虽 然 不 管 在 哪 种 平台 上 用 C 语 言 编程 在 很 多 方面 都 是 一 
样 的 ， 但 UNIX 和 Linux 开 发 者 对 编程 和 系统 开发 确实 有 其 独特 的 观点 。 

UNIX 操 作 系 统 〈 包 括 Linux) 鼓励 一 种 特定 的 编程 风格 。 下 面 列 出 
了 一 些 典型 的 UNIX 程 序 和 系统 所 具有 的 特点 。 

O 简单 性 ， 许多 很 有 用 的 UNIX 工 具 是 非常 简单 的 ， 因 此 也 是 很 小 

并 易于 理解 的 。“ 小 而 简单 ” (KISS: Keep It Small and Simple) 是 

一 种 值得 学 习 的 技术 。 越 大 、 越 复杂 的 系统 注定 包含 越 大 、 越 复杂 

的 错误 ， 而 调试 是 我 们 所 有 人 都 想 避 免 的 苦 差 事 。 

Oo 集中 性 : 通常 ， 让 一 个 程序 很 好 地 执行 一 项 任务 要 好 过 把 所 有 

功能 都 乱七八糟 地 堆 在 一 起 。 功 能 腑 肿 的 程序 难于 使 用 和 维护 ， 只 

有 单一 目标 的 程序 更 容易 随 着 更 好 的 算法 或 界面 被 开发 出 来 而 得 到 

改进 。 在 UNIX 中 ， 当 用 户 出 现 新 的 需求 时 ， 我 们 通常 是 把 小 工具 

组 合 起 来 以 完成 更 复杂 的 任务 ， 而 不 是 试图 将 一 个 用 户 期 望 的 所 有 

功能 放 在 一 个 大 程序 里 。 

Oo 可 重用 组 件 : 将 应 用 程序 的 核心 实现 为 库 。 具 有 简单 而 灵活 的 

编程 接口 、 文 档 齐备 的 库 可 以 帮助 其 他 人 开发 出 同类 程序 ， 或 者 把 

这 些 技术 应 用 到 新 的 应 用 领域 。dbm 库 就 是 一 个 例子 ， 它 是 一 组 可 

重用 的 函数 ， 而 不 是 单一 的 数据 库 管理 程序 。 

O 过 滤器 : 许多 UNIX 应 用 程序 可 用 作 过 滤器 。 也 就 是 说 ， 它 们 对 

输入 进行 转换 并 产生 输出 。 正 如 你 将 在 后 面 看 到 的 ，UNIX 提 供 了 

一 些 机 制 ， 让 我 们 可 以 把 一 些 UNIX 程 序 通过 一 种 新 颖 的 方式 组 合 

起 来 ， 以 开发 出 相当 复杂 的 应 用 程序 。 当 然 ， 这 种 类 型 的 重用 是 靠 

我 们 前 面 提 到 的 开发 方法 文 撑 的 。 

O 开放 的 文件 格式 比较 成 功 并 流行 的 UNIX 程 序 都 使 用 纯 ASCII 

码 的 文本 文件 或 XML 文件 作为 配置 文件 和 数据 文件 。 如 果 你 在 开 

发 程序 时 采用 了 任 一 种 做 法 ， 那 你 做 对 了 ! 它 使 用 户 可 以 用 标准 工 

具 来 修改 和 搜索 配置 项 ， 并 且 可 以 开发 出 新 工具 在 数据 文件 上 执行 

新 的 功能 。ctags 源 代码 交叉 引用 系统 就 是 一 个 好 例子 ， 它 把 符号 位 

置信 息 以 适合 于 搜索 程序 使 用 的 正则 表达 式 的 形式 记录 下 来 。 

O 灵活 性 : 你 不 能 期 待 用 户 都 能 非常 正确 地 使 用 你 的 程序 。 所 

以 ， 你 在 编程 时 应 尽量 考虑 到 灵活 性 ， 尽 量 避 免 随 意 限制 字段 长 度 

或 记录 数目 。 如 果 你 能 做 到 的 话 ， 则 你 编写 的 网 络 程序 既 能 在 单机 


运行 ， 也 能 跨 网 络 运行 。 永 远 不 要 认为 你 知道 用 户 想 做 的 一 切 


可 能 你 已 经 知道 ，Linux 是 一 个 可 以 自由 发 布 的 类 UNIX 内 核实 现 ， 
它 是 一 个 操作 系统 的 底层 核心 。 因 为 Linux 以 UNIX 系 统 为 其 灵感 来 源 ， 
所 以 Linux 程 序 和 UNIX 程 序 是 非常 相似 的 。 事 实 上 ， 几 乎 所 有 为 UNIX 
编写 的 程序 都 可 以 在 Linux 上 编译 运行 。 而 且 ， 一 些 专用 于 UNIX 商 业 版 
T 也 可 以 不 加 改变 地 以 二 进 制 形式 运行 在 Linux 系 统 


Linux 是 由 赫尔辛基 大 学 的 Linus Torvalds 开 发 的 ， 期 间 得 到 了 因 特 
网 上 广大 UNIX 程 序 员 的 帮助 。 它 最 初 只 是 受 Andy ”Tanenbaum 教 授 的 
Minix (一 个 小 型 的 类 UNIX 系 统 ) 启发 而 开发 的 程序 ， 纯 属 个 人 爱好 ， 
但 后 来 它 自 身 逐 步 发 展 成 为 一 个 完整 的 系统 。 其 开发 目的 是 保证 Linux 
除 包含 可 以 自由 发 布 的 代码 外 ， 不 会 集成 任何 专 有 代码 。 

现在 ， 使 用 不 同类 型 CPU 的 计算 机 系统 都 有 Linux 的 版 本 可 以 运行 
其 上 ， 包 括 基于 32 位 和 64 位 Intel x86 及 其 兼容 处 理 器 的 个 人 计算 机 、 使 
用 SUN SPARC, IBM PowerPC, AMD Opteron, Intel Itanium 的 工作 站 
和 服务 器 ， 甚 至 一 些 手持 PDA 和 Sony PS2/PS3 游 戏 机 。 只 要 这 个 设备 有 
处 理 堪 ， 就 会 有 人 试图 让 Linux 运 行 其 上 。 


1.1.3 GNU HAI 炙 件 基金 会 


Linux 能 够 存在 并 发 展 到 今天 是 无 数 人 共同 努力 的 结果 。 操 作 系 统 
内 核 本 身 仅仅 是 可 用 开发 系统 的 一 小 部 分 。 传 统 上 ， 商 业 化 的 UNIX 系 
统 都 包含 提供 系统 服务 和 工具 的 应 用 程序 。 对 Linux 系 统 来 说 ， 这 些 额 
外 的 程序 是 由 许多 程序 员 编 写 并 自由 发 布 的 。 

Linux 社 区 (以 及 其 他 的 软件 开发 组 织 ) 支持 自由 软件 的 概念 ， 即 
软件 本 身 不 应 受 限 ， 它 们 应 遵守 GNU (GNU 是 GNU’s Not UNIX 的 递归 
缩写 ) 通用 公共 许可 证 (GPL) 。 虽 然 获得 软件 可 能 要 支付 一 定 的 费 
但 此 后 就 可 以 随意 使 用 它们 ， 并 且 它 们 通常 是 以 源 代 码 的 形式 发 


自由 软件 基金 会 (Free Software Foundation) 由 Richard Stallman 创 
立 ， 他 是 UNIX 及 其 他 系统 上 最 著名 的 文本 编辑 软件 之 一 GNU Emacs 的 
开发 者 。Stallman 是 自由 软件 这 一 概念 的 倡导 者 ， 并 发 起 了 GNU 项 目 ， 
这 个 项 目的 宗旨 是 : 试图 创建 一 个 与 UNIX 系 统 兼容 ， 但 并 不 受 UNIX 名 


字 和 源 代码 私有 权限 制 的 操作 系统 和 开发 环境 。 可 能 有 一 天 ，GNU 处 理 
硬件 和 管理 运行 程序 的 方式 会 变 得 与 UNIX 完 全 不 同 ， 但 它 仍 然 会 继续 
支持 UNIX 类 型 的 应 用 程序 。 

GNU 项 目 已 为 软件 社区 提供 了 许多 UNIX 系 统 上 应 用 程序 的 仿制 
品 。 所 有 这 些 程序 ， 即 GNU 软 件 ， 都 是 在 GNU 通 用 公共 许可 证 
(GPL) 的 条 球 下 发 布 的 。 你 可 以 在 http: /www.gnu.org 上 找到 该 许可 
证 的 一 份 副 本 。 这 份 许 可 证 阐述 了 copyleft (copyleft 是 一 个 生 造 的 词 ， 
是 英文 copyright 的 反 话 ) 的 概念 。 copyleft 的 目的 是 防止 有 人 给 自由 软 
件 的 使 用 加 上 限制 。 

下 面 是 在 GPL 条 款 下 发 布 的 一 些 主要 的 GNU 项 目 软件 。 
GCC: GNU 编 译 占 集 ， 它 包括 GNU Ga 
G++: C++ 编译 器 ， 是 GCC 的 一 部 分 
GDB: 源 代 码 级 的 调试 器 。 
GNU make: UNIX make 命 令 的 免费 版 本 。 
Bison: (SUNIX yacc 兼 容 的 语法 分 析 程 序 生成 器 。 
bash: 命令 解释 器 (shell) 。 
GNU Emacs: 文本 编辑 器 及 环境 。 

许多 其 他 的 软件 包 也 是 在 遵守 自由 软件 的 原则 和 GPL 条 球 的 情况 下 
开发 和 发 行 的 ， 包 括 电 子 表格 、 源 代码 控制 工具 、 编 译 占 和 解释 器 、 因 
特 网 工具 、 图 形 图 像 处 理工 具 ( 如 Gimp) ， 以 及 两 个 完整 的 基于 对 象 
的 环境 (GNOME 和 KDE) 。 我 们 将 在 第 16 章 和 第 17 章 讨论 CNOME 和 
KDE. 

现在 有 这 人 么 多 可 用 的 目 由 软件 ， 再 加 上 Linux 内 核 ， 我 们 可 以 说 : 
创建 一 个 GNU 的 、 自 由 的 类 UNIX 系 统 的 目标 已 经 通过 Linux 系 统 实现 
了 。 由 于 认识 到 GNU 软 件 所 做 出 的 贡献 ， 现 在 许多 人 通 浓 都 把 Linux 系 
统称 为 GNU/Linux。 

你 可 以 在 http: /www.gnu.org 上 找到 更 多 关于 自由 软件 的 概念 。 


1.1.4 Linux 发 行 版 


正如 我 们 前 面 提 到 的 ，Linux 实 际 上 只 是 一 个 内 核 。 你 可 以 获得 内 
核 源 代码 ， peal 然后 获得 并 安装 许多 其 他 自由 发 布 的 软件 ， 
从 而 完成 一 个 完整 Linux 系 统 的 安装 。 我 们 通常 将 这 样 安装 所 得 的 系统 
eel 这 是 因为 它 包 含 的 远 不 止 一 个 Linux 内 核 。 系 统 中 大 多 
数 的 工具 都 来 自 于 自由 软件 基金 会 的 GNU 项 目 。 

你 可 能 会 意识 到 ， 仅 从 源 代 码 开 始 创建 Linux 系 统 是 一 件 很 个 容易 
的 事 。 地 运 的 是 ， 许 多 人 制作 了 准备 好 安装 的 Linux 发 行 版 (通常 称 为 


goaa 


flavor) ， 它 一 般 可 下 载 或 以 CD-ROM/DVD 为 载体 。 它 不 仅 包 含 内 核 ， 
还 包含 许多 其 他 编程 工具 和 应 用 程序 。 它 通常 都 会 包含 一 个 X 视 窗 系 统 
的 实现 ， 即 在 许多 UNIX 系 统 上 都 有 的 一 个 图 形 化 环境 。Linux 发 行 版 通 
常 还 带 有 安装 程序 和 附加 文档 (这 些 一 般 也 都 在 CD 上 ， ， 帮 助 你 安装 
自己 的 Linux 系 统 。 一 些 著 名 的 Linux 发 行 版 〈 特 别 是 在 Intel x86 系 列 处 
理 器 上 的 发 行 版 ) 有 Red Hat Enterprise Linux 及 其 社区 开发 版 的 Fedora、 
Novell SuSE ”Linux 及 其 免费 的 openSUSE 变 体 、Ubuntu Linux, 
Slackware、Gentoo 和 Debian GNU/Linux， 更 多 Linux 发 行 版 的 详细 信息 
可 访问 Distro Watch 网 站 http: //distrowatch.com。 


1.2 Linux 程 序 设 计 


许多 人 认为 Linux 程 序 设 计 就 是 用 C 语 言 编程 。 的 确 ，UNIX 最 初 是 
用 C 语 言 编写 的 ， 并 且 UNIX 的 大 多 数 应 用 程序 也 是 用 C 语 言 编 号 的 ， 但 
C 语 言 并 不 是 Linux 程 序 员 或 UNIX 程 序 员 的 唯一 选择 。 在 本 书 中 ， 我 们 
将 介绍 几 种 其 他 的 选择 。 


事实 上 ，UNIX 的 第 一 个 版 本 是 在 1969 年 用 PDP7 机 器 的 汇编 
语言 编写 的 。 差 不 多 也 在 个 时 候 ，Dennis Ritchie 发 明了 CERF, 
并 于 1973 年 与 Ken Thompson 一 起 用 C 语 言 重 写 了 整个 UNIX 内 核 ， 
ee eer 时 代 的 确 是 个 了 不 起 


对 Linux 系 统 来 说 ， 有 各 种 各 样 的 编程 语言 可 供 选 用 ， 其 中 许多 是 
免费 的 ， 它 们 可 以 通过 CD-ROM 光 盘 获 得 或 在 因特网 上 通过 FTP 站 点 下 
载 。 表 1-1 列 出 了 Linux 程 序 员 可 用 的 部 分 编程 语言 。 

1-1 
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我 们 将 在 第 2 章 向 读者 显示 如 何 用 Linux 的 shell (bash) 来 开发 小 规 
模 到 中 等 规模 的 应 用 程序 。 在 本 书 的 其 他 章节 ， 我 们 主要 集中 在 C 话 言 
上 。 我 们 将 集中 精力 从 C 语 言 程序 员 的 视角 探究 Linux 编 程 接 口 。 我 们 假 
设 读者 具备 C 语 言 编程 的 基础 。 


1.2.1 Linux 程 序 


Linux 应 用 程序 表现 为 两 种 特殊 类 型 的 文件 ， 可 执行 文件 和 脚本 文 
件 。 可 执行 文件 是 计算 机 可 以 直接 运行 的 程序 ， 它 们 相当 于 Windows 中 
的 .exe 文 件 。 脚 本 文件 是 一 组 指令 的 集合 ， 这 些 指令 将 由 另 一 个 程序 
CBU RRR AS) 来 执行 ， 它 们 相当 于 Windows 中 的 .bat 文 件 、.cmd 文 件 或 
解释 执行 的 BASIC 程 序 。 


Linux 并 不 要 求 可 执行 文件 或 脚本 文件 具有 特殊 的 文件 名 或 扩展 
名 。 文 件 系统 属性 〈 我 们 将 在 第 2 章 中 讨论 ) 用 来 指明 一 个 文件 是 否 关 
可 执行 的 程序 。 在 Linux 中 ， 你 可 以 用 编译 过 的 程序 代替 脚本 《反之 亦 
SR) 而 不 会 影响 其 他 程序 或 调用 者 。 事 实 上， 在 用 户 级 别 ， 这 两 者 本 质 
上 没有 任何 不 同 。 

当 登 录 进 Linux 系 统 时 ， 你 与 一 个 shell 程 序 (通常 是 bash) 进行 交 
互 ， 它 像 Windows 中 的 命令 提示 窗口 一 样 运行 程序 。 它 在 一 组 指定 的 目 
录 路 径 下 按照 你 给 出 的 程序 名 搜索 与 之 同名 的 文件 。 搜 索 的 目录 路 径 存 
储 在 shell 变 量 PATH 里 ， 这 一 点 与 Windows 也 很 类 似 。 搜 索 路 径 〈 你 也 
可 以 添加 这 个 路 径 ) 由 系统 管理 员 配 置 ， 它 通常 包含 如 下 一 些 存储 系统 
程序 的 标准 路 径 。 

O /bin: 二 进 制 文件 目录 ， 用 于 存放 启动 系统 时 用 到 的 程序 。 

O /usr/bin: 用 户 二 进 制 文件 目录 ， 用 于 存放 用 户 使 用 的 标准 程 


序 。 
/usr/local/bin: 本 地 二 进 制 文件 目录 ， 用 于 存放 软件 安装 的 程 


Po 

系统 管理 员 〈 例 如 root 用 户 ) 登录 后 使 用 的 PATH 变量 可 能 还 包含 
存放 系统 管理 程序 的 目录 ， 如 /sbin 和 /usr/sbin。 

可 选 的 操作 系统 组 件 和 第 三 方 应 用 程序 可 能 被 安装 在 /opt 目 录 下 ， 
安装 程序 可 以 通过 用 户 安装 脚本 将 路 径 添 加 到 PATH 环境 变量 中 。 


从 PATH 中 删除 目录 并 不 是 一 个 好 主意 ， 除 非 确 信 你 了 解 这 
么 做 的 后 果 。 


注意 ，Linux 像 UNIX 一 样 ， 使 用 冒号 Co ) 分 隔 PATH 变 量 里 的 条 
目 ， 而 不 是 像 MS-DOS 和 Windows 使 用 分 号 G ) 。 (CUNIX 使 用 冒号 : 
在 先 ， 所 以 应 该 问 微软 为 什么 Windows 要 采用 不 同 的 方式 ， 而 不 是 问 
UNIX 为 什么 与 之 不 同 ! ) 下 面 是 一 个 PATH 变量 的 例子 : 


cal/bin: /bin: /usr/bin h ASI 


上 面 的 PATH 变量 包含 的 条 目 有 : 标准 程序 存放 位 置 、 当 前 目录 
(.) 、 一 个 用 户 的 家 目录 和 X 视 窗 系 统 的 目录 。 


WIE, Linx H ENAR (/) 分 隔 文件 名 里 的 目录 名 ， 而 不 是 
像 Windows 那 样 用 反 斜 线 A) 。 而 且 这 次 还 是 UNIX 的 用 法 在 
site 


1.2.2 VA nt 


编写 和 输入 本 书 中 的 代码 需要 使 用 一 个 编辑 嚣 。 在 典型 的 Linux 系 
统 上 有 许多 编辑 占 可 用 ， 较 流行 的 编辑 器 是 vi。 

本 书 的 两 位 作者 都 喜欢 Emacs， 所 以 我 们 建议 你 花 一 点 时 间 来 学 习 
这 个 功能 强大 的 编辑 器 。 几 乎 所 有 的 Linux 发 行 版 都 将 Emacs 作为 可 选 的 
安装 包 ， 你 也 可 以 从 GNU 网 站 http: /www.gnu.org 上 得 到 它 ， 或 者 在 
XEmacs 网 站 http: /www.xemacs.org 上 得 到 它 的 图 形 化 环境 版 本 。 

要 更 深入 地 学 习 Emacs， 你 可 以 使 用 它 的 在 线 指 南 。 首 先 运行 emacs 
命令 以 启动 编辑 器 ， 然 后 输入 CtrlI+H， 接 着 输入 字母 t 就 进入 了 在 线 指 
南 。Emacs 也 有 完整 的 用 户 手册 。 在 Emacs 中 输入 Ctrl+H， 接 着 输入 字母 


人 言 轧 。 有 些 版 本 的 Emacs 可 能 包含 访问 手册 和 指南 的 荣 


在 POSIX 兼 容 的 系统 中 ，C 话 言 编译 器 被 称 为 c89。 历 史上 ，C 话 言 
编译 器 被 简称 为 cc。 许 多 年 来 ， 不 同 厂商 销售 的 类 UNIX 系 统 中 所 带 的 C 
语言 编译 器 均 包 含 不 同 的 功能 和 选项 ， 但 它们 一 般 都 称 为 cc。 

在 准备 起 草 POSIX 标 准时 ， 事 实 上 已 经 不 可 能 制订 出 兼容 所 有 厂商 
的 标准 cc 命令 了 。 于 是 ，POSIX 委 员 会 决定 为 C 语 言 编译 器 创建 新 的 标 
Laine 这 就 是 c89。 只 要 使 用 这 个 命令 ， 在 任何 机 器 上， 它 的 编译 选 
项 都 相同 。 

Linux 系 统 尽量 实现 这 些 标准 。 在 Linux 系 统 中 ， 你 会 发 现 c89、cc 和 
gcc 这 些 命 令 全 部 或 部 分 地 指 同 系统 的 C 语 诗 编 译 占 ， 通 第 是 GNU C 编 译 
器 ， 或 gcc。 在 UNIX 系 统 中 ，C 语 言 编译 器 几乎 总 被 称 为 cc。 

在 本 书 中 ， 我 们 将 使 用 gcc， 这 是 因为 它 随 Linux 的 发 行 版 一 起 提 
供 ， 并 且 它 支持 C 语 言 的 ANSI 标 准 语法 。 如 果 你 发 现 你 的 UNIX 系 统 中 
没有 gcc， 我 们 建议 你 设法 获取 并 安装 它 。 你 可 以 在 
http: /www.gnu.org 上 找到 它 。 我 们 在 本 书 中 用 到 gcc 之 处 ， 你 都 可 以 直 
接 将 其 蔡 换 为 你 的 系统 中 C 语 言 编 译 器 相应 的 命令 。 


实 验 你 的 第 一 个 Linux C 语 言 程序 
在 本 例 中 ， 通 过 编写、 编译 和 运行 你 的 第 一 个 Linux 程 序 来 开始 
Linux 的 C 语 言 程序 开发 之 旅 。 还 是 从 最 有 名 的 Hello World 程 序 开始 吧 。 
(1) 下 面 是 文件 hello.c 的 源 代码 : 


#include <stdio.h> 


#include <stdlib.h> 


int main() 


printf("Hello World\n"); 
exit (0); 


} 
(2) 编译、 链接 和 运行 程序 。 
$ gcc -o hello hello.c 


S ./hello 
Hello World 


$ 


试验 解析 

你 调用 GNU ”Cc 语言 编译 器 (在 Linux 中 ， 大 多 数 情 况 下 用 cc 也 可 
以 ) 将 C 语 言 源 代码 转换 为 可 执行 文件 hello。 然 后 运行 这 个 程序 ， 它 将 
打印 出 欢迎 信息 。 虽 然 这 只 是 最 简单 的 一 个 例子 ， 但 如 果 在 你 的 系统 上 
能 做 到 这 一 点 ， 你 就 能 编译 、 运 行 本 书 中 以 后 所 有 的 例子 了 。 如 果 无 法 
完成 上 述 操作 ， 请 检查 你 的 系统 以 确保 已 安装 了 C 语 言 编译 器 。 例 如 ， 
许多 Linux 发 行 版 有 个 名 为 Software Development 〈 软 件 开 发 ) 的 安装 选 
项 (或 类 似 选 项 ) ， 你 应 该 在 Linux 系 统 安装 过 程 中 选中 该 项 ， 从 而 确 
保安 装 了 所 需 的 软件 包 。 

因为 这 是 你 运行 的 第 一 个 程序 ， 所 以 有 些 问 题 最 好 现在 就 指出 来 。 
hello 程 序 很 可 能 在 你 的 家 目录 中 。 如 果 PATH 变 量 不 包含 指向 你 的 家 目 
录 的 条 目 ，shell 就 找 不 到 hello 程 序 。 更 进一步 ， 如 果 PATH 变 量 中 包含 
的 其 中 一 个 目录 包含 另 一 个 名 为 hello 的 程序 ，shell 就 会 执行 那个 程序 。 
如 果 PATH 中 这 样 的 目录 出 现在 你 的 家 目录 之 前 ， 这 种 情况 也 会 发 生 。 
为 了 避免 这 种 潜在 的 问题 ， 你 可 以 在 程序 名 前 加 上 一 个 ./( 例 


如 .hello) 。 它 特别 指示 shell 去 执行 当前 目录 下 给 定名 称 的 程序 。“〈 符 
号 .代表 当前 目录 。) 

如 果 你 忘记 用 -o name 选 项 告诉 编译 器 可 执行 程序 的 名 字 ， 编 译 器 
就 会 把 程序 放 在 一 个 名 为 a.out 的 文件 里 (a.out 的 含义 是 assembler 
output， 即 汇编 输出 ) 。 如 果 你 确信 编译 了 一 个 程序 但 又 找 不 到 它 ， 别 
忘 了 看 看 有 没有 a.out 文 件 ! 在 UNIX 的 早期 历史 中 ， 想 在 系统 上 玩 游戏 
的 人 通常 把 游戏 作为 a.out 来 运行 ， 以 避免 被 系统 管理 员 捉 到 ， 因 此 一 些 
UNIX 系 统 每 晚会 定期 地 删除 所 有 名 为 a.out 的 文件 。 


1.2.4 系统 导 


对 Linux 开 发 人 员 来 说 ， 了 解 软件 工具 和 开发 资源 在 系统 中 存放 的 
位 置 是 很 重要 的 。 以 下 几 节 将 简单 介绍 一 些 重 要 的 目录 和 文件 。 


1. 应 用 程序 


应 用 程序 通常 存放 在 系统 为 之 保留 的 特定 目录 中 。 系 统 为 正常 使 用 
提供 的 程序 ， 包 括 用 于 程序 开发 的 工具 ， 都 可 在 目录 /usr/bin 中 找到 ; 系 
统管 理 员 为 某 个 特定 的 主机 或 本 地 网 络 添加 的 程序 通常 可 在 目 
录 /usr/local/bin 或 /opt 中 找到 。 

系统 管理 员 一 般 喜 欢 使 用 /opt 和 /usr/local 目 录 ， 因 为 它们 分 离 了 厂 
商 提 供 及 后 续 添 加 的 文件 与 系统 本 喘 提 供 的 应 用 程序 。 一 直 保 持 以 这 种 
方式 组 织 文件 的 好 处 在 你 需要 升级 操作 系统 时 承 可 以 看 出 来 了 ， 因 为 只 
有 目录 /opt 和 /usr/local 里 的 内 容 需 要 保留 。 我 们 建议 对 于 系统 级 的 应 用 
程序 ， 你 可 以 将 它 放 在 /usr/local 目 录 中 来 运行 和 访问 所 需 的 文件 。 对 于 
AA 和 个 人 的 应 用 程序 ， 最 好 在 你 的 家 目录 中 使 用 一 个 文件 夹 来 存放 
已 


其 他 一 些 功能 特性 和 编程 系统 可 能 有 其 自己 的 目录 结构 和 程序 目 
录 。 其 中 最 主要 的 一 个 就 是 X 视 窗 系 统 ， 它 通 间 安装 在 /usrX11 
或 /usr/bin/X11 目 录 中 。Linux 发 行 版 通常 使 用 X 视 窗 系 统 的 X.Org 基金 会 
版 本 ， 它 基于 修订 版 7 (XI11R7) 。 其 他 类 UNIX 系 统 可 能 选择 X 视 窗 系 
统 的 其 他 版 本 ， 它 们 被 安装 到 不 同 的 位 置 ， 如 Solaris 提 供 的 Sun Open 
Windows 被 安装 到 /usr/openwin 目 录 中 。 

GNU 编 译 系统 的 驱动 程序 gcc《〈 你 已 在 本 章 前 面 的 编程 示例 中 用 
过 ) 一 般 位 于 /usr/bin 或 、/usr/local/bin 目 录 中 ， 但 它 会 从 其 他 位 置 运行 各 
种 编译 器 文 持 的 应 用 程序 。 这 个 位 置 是 在 编译 编译 器 本 里 时 指定 的 ， 并 
且 它 随 主 机 类 型 的 不 同 而 不 同 。 对 Linux 系 统 来 说 ， 这 个 位 置 可 能 


是 /usr/lib/gcc/ 目 录 下 的 一 个 版 本 特定 的 子 目录 。 在 撰写 本 书 时 ， 这 个 目 
录 在 本 书 其 中 一 位 作者 的 机 器 上 是 /usr/lib/gcc/i586-suse-linux/4.1.3。 
GNU C/C++ 编译 器 的 各 个 工具 和 GNU 专 用 的 头 文件 都 保存 在 这 里 。 


2. 头 文件 


用 C 语 言及 其 他 语言 进行 程序 设计 时 ， 你 需要 用 头 文件 来 提供 对 季 
量 的 定义 和 对 系统 函数 及 库 函 数 调用 的 声明 。 对 C 语 言 来 说 ， 这 些 头 文 
件 几乎 总 是 位 于 /usr/include 目 录 及 其 子 目 录 中 。 那 些 依赖 于 特定 Linux 版 
本 的 头 文件 通常 可 在 目录 /uswinclude/sys 和 /swinclude/linux 中 找到 。 

其 他 编程 系统 也 有 各 目的 头 文件 ， 这 些 头 文件 被 存储 在 可 被 相应 编 
译 器 自动 搜索 到 的 目录 里 。 例 如 ，X 视 窗 系 统 的 /asvVinclude/Xl 目录 和 
GNU C++ 的 /usrinclude/c++ 目 录 。 

在 调用 C 语 言 编译 器 时 ， 你 可 以 使 用 -I 标志 来 包含 保存 在 子 目 录 或 
非 标 准 位 置 中 的 头 文件 。 例 如 : 


$ gcc -I/usr/openwin/include fred.c 


它 指示 编译 堪 不 仅 在 标准 位 置 ， 也 在 /usvopenwiminclude 目 录 中 和 查找 程 
序 fred.c 中 包含 的 头 文件 。 请 参看 C 语 言 编译 器 的 使 用 手册 (man gee) 
以 了 解 更 多 细节 。 

用 grep 命 令 来 搜索 包含 某 些 特定 定义 和 函数 原型 的 头 文 件 是 很 方便 
的 。 假 设想 知道 用 于 从 程序 中 返回 退出 状态 定义 的 名 字 ， 你 只 需 切 换 
到 /usr/include 目 录 下 ， 然 后 用 grep 命 令 搜 索 可 能 的 名 字 部 分 ， 如 下 所 
ZN: 


> grep EXIT_ *.h 


上 面 的 grep 命 令 在 当前 目录 下 的 所 有 以 .h 结 尾 的 文件 中 搜索 字符 串 
EXIT 。 在 本 例 中 ， 它 在 stdlib.h 文 件 中 找到 了 你 需要 的 定义 。 


3. 库 文件 


库 是 一 组 预先 编译 好 的 函数 的 集合 ， 这 些 函 数 都 是 按照 可 重用 的 原 
则 编写 的 。 它 们 通 第 由 一 组 相互 关联 的 函数 组 成 以 执行 菜 项 常见 的 任 
务 ， 比 如 屏幕 处 理 函 数 库 〈curses 和 ncurses 库 ) 和 数据 库 访问 例 程 
Cdbm 库 ) 。 我 们 将 在 后 续 的 章节 中 介绍 一 些 函 数 库 。 


标准 系统 库 文件 一 般 存 储 在 /lib 和 /usr/ib 目 录 中 。C 语 言 编 译 器 (或 
更 确切 地 说 是 链接 程序 ) 需要 知道 要 搜索 哪些 库 文 件 ， 因 为 在 默认 情况 
下 ， 它 只 搜索 标准 C 语 言 库 。 这 是 从 那个 计算 机 速度 还 很 慢 而 且 CPU 运 
行 周 期 还 很 昂贵 的 时 代 遗 留 下 来 的 问题 。 仅 把 库 文 件 放 在 标准 目录 中 ， 
就 希望 编译 器 能 够 找到 它 是 不 够 的 ， 库 文件 必须 遵循 特定 的 命名 规范 并 
且 需 要 在 命令 行 中 明确 指定 。 

库 文件 的 名 字 总 是 以 lib 开 头 ， 随 后 的 部 分 指明 这 是 什么 库 〈 例 如 ， 
c 代 表 C 语 言 库 ，m 代 表 数 学 库 ) 。 文 件 名 的 最 后 部 分 以 .开始 ， 然 后 给 出 
库 文 件 的 类 型 : 

O .a 代表 传统 的 静态 水 数 库 ; 

口 “.So 代 表 共 享 函 数 库 〈 见 后 面 的 解释 ) 。 

函数 库 通 名 同时 以 静态 库 和 共享 库 两 种 格式 存在 ， 你 可 用 lsmuswlib 
命令 得 看 。 你 可 以 通过 给 出 完整 的 库 文 件 路 径 名 或 用 -1 标志 来 告诉 编译 
器 要 搜索 的 库 文 件 。 例 如 : 
$ gcc -o fred fred.c /usr/lib/libm.a 

这 条 命令 要 求 编译 器 编译 文件 fred.c， 将 编译 产生 的 程序 文件 命名 
为 fred， 并 且 除 了 搜索 标准 的 C 语 言 函数 库 外 ， 还 搜索 数学 库 以 解决 函 
数 引 用 问题 。 下 面 的 命令 也 能 产生 类 似 的 结果 : 


$ gcc -o fred fred.c -lm 
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里 很 有 用 ) ， 它 代表 的 是 标准 库 目 录 〈 本 例 中 是 mswlib) 中 名 为 libm.a 
外 
共享 库 。 

虽然 库 文 件 和 头 文件 一 样 ， 通 常 都 保存 在 标准 位 置 ， 但 你 也 可 以 通 
过 使 用 工 〈 大 写字 母 ) 标志 为 编译 器 增加 库 的 搜索 路 径 。 例 如 : 


$ gcc -o xllfred -L/usr/openwin/lib xllfred.c -1X11 


这 条 命令 用 /usr/openwin/lib 目 录 中 的 libX11 库 版 本 来 编译 和 链接 程 
序 x11fred。 


函数 库 最 简单 的 形式 是 一 组 处 于 “准备 好 使 用 ?状态 的 目标 文件 。 当 
程序 需要 使 用 函数 库 中 的 某 个 函数 时 ， 它 包含 一 个 声明 该 函数 的 头 文 
件 。 编 译 器 和 链接 器 负责 将 程序 代码 和 函数 库 结 合 在 一 起 以 组 成 一 个 单 


ee le eter earner ane tay 

静态 库 ， 也 称 作 归 档 文件 〈archive) ， 按 惯例 它们 的 文件 名 都 以 .a 
结尾 。 比 如 ， 标 准 C 语 言 函 数 库 /aswliby/libc.a 和 XI 函数 
J fusr/lib/libX11.a. 

你 可 以 很 容易 地 创建 和 维护 自己 的 静态 库 ， 只 要 使 用 ar 〈 代 表 
archive， 即 建立 归档 文件 ) 程序 和 使 用 gcc | -c 命 令 对 函数 分 别 进行 编 
译 。 你 应 该 尽 可 能 把 函数 分 别 保存 到 不 同 的 源 文件 中 。 如 果 函 数 需 要 访 
问 公共 数据 ， 你 可 以 把 它们 放 在 同一 个 源 文件 中 ， 并 使 用 在 该 文件 中 声 
明 的 静态 变量 。 


X 验 静态 库 

在 本 例 中 ， 你 将 创建 一 个 小 型 函数 库 ， 它 包含 两 个 函数 ， 然 后 你 将 
在 一 个 示例 程序 中 调用 其 中 一 个 函数 。 这 两 个 函数 分 别 是 fred 和 bill， 它 
们 只 打印 欢迎 信息 。 

(1) 首先 ， 为 两 个 函数 分 别 创 建 各 目的 源 文件 (将 它们 分 别 命 名 
为 fred.c 和 bill.c〉 。 下 面 是 第 一 个 源 文 件 : 


#include <stdio.h> 


void fred(int ara) 


printf£("fred: we passed %d\n", arg); 


下 面 是 第 二 个 源 文件 : 


finclude <stdio.h> 


printf("bill: we passed %s\n", arg); 


C2) 你 可 以 分 别 编译 这 些 函 数 以 产生 要 包含 在 库 文件 中 的 目标 文 
件 。 这 可 以 通过 调用 带 有 -c 选 项 的 C 语 言 编译 器 来 完成 ，-c 选 项 的 作用 
是 阻止 编译 器 创建 一 个 完整 的 程序 。 如 果 此 时 试图 创建 一 个 完整 的 程序 


将 不 会 成 功 ， 因 为 你 还 未 定义 main 函 数 。 
$gcc -c bill.c fred.c 
Sls *.o 
bill.o fred.o 


(3) 现在 编写 一 个 调用 bi 函数 的 程序 。 首 先 ， 为 你 的 库 文 件 创建 
一 个 头 文 件 。 这 个 头 文 件 将 声明 你 的 库 文件 中 的 函数 ， 它 应 该 被 所 有 希 
望 使 用 你 的 库 文件 的 应 用 程序 所 包含 。 把 这 个 头 文件 包含 在 源 文 件 
fred.c 和 bill.c 中 是 一 个 好 主意 ， 它 将 帮助 编译 器 发 现 所 有 错误 。 


This is lib.h. It declares the functions fred and bill for user 


my 


void bill(char *); 


void fred(int) ; 


(4) 调用 程序 Cprogram.c) 非常 简单 。 它 包含 库 的 头 文 件 并 且 调 
用 库 中 的 一 个 函数 。 
finclude <stdlib.h> 


finclude "lib.h" 


int main() 


(5) 现在 ， 你 可 以 编译 并 测试 这 个 程序 了 。 你 和 暂时 为 编译 器 显 式 
指定 目标 文件 ， 然 后 要 求 编译 器 编译 你 的 文件 并 将 其 与 先前 编译 好 的 目 
标 模 块 bill.o 链 接 。 


$ gcc -c program.c 

$ gcc -o program program.o bill.o 
$ ./program 

bill: we passed Hello World 


$ 

(6) 现在 ， 你 将 创建 并 使 用 一 个 库 文 件 。 你 使 用 ar 程序 创建 一 个 
归档 文件 并 将 你 的 目标 文件 添加 进去 。 这 个 程序 之 所 以 称 为 ar， 是 因为 
它 将 若干 单独 的 文件 归并 到 一 个 大 的 文件 中 以 创建 归档 文件 或 集合 。 注 
意 ， 你 也 可 以 用 ar 程 序 来 创建 任何 类 型 文件 的 归档 文件 (与 许多 UNIX 
工具 一 样 ，ar 是 一 个 通用 工具 ) . 


Sar crv libfoo.a bill.o fred.o 
a - bill.o 


a - fred.o 


(7) 库 文件 创建 好 了 ， 两 个 目标 文件 也 已 添加 进去 。 在 茶 些 系 
统 ， 尤 其 是 从 Berkeley UNIX 衍生 的 系统 中 ， 要 想 成 功 地 使 用 函数 库 ， 
你 还 需要 为 函数 库 生 成 一 个 内 容 表 。 你 可 以 通过 ranlib 命 令 来 完成 这 一 
工作 。 在 Linux 中 ， 当 你 使 用 的 是 GNU 的 软件 开发 工具 时 ， 这 一 步骤 并 
不 是 必需 的 《但 做 了 也 无 妨 ) 。 


Sranlib libfoo.a 
你 的 函数 库 现 在 可 以 使 用 了 。 你 可 以 在 编译 器 使 用 的 文件 列表 中 添 
加 该 库 文件 以 创建 你 的 程序 ， 如 下 所 示 : 


$ gcc -o program program.o libfoo.a 
$ ./program 
bill: we passed Hello World 


你 也 可 以 使 用 -1 选项 来 访问 函数 库 ， 但 因 其 未 保存 在 标准 位 置 ， 所 
以 你 必须 使 用 工 选项 来 告诉 编译 器 在 何 处 可 以 找到 它 ， 如 下 所 示 : 


S$ gcc -DO program program.o -L. -lfoo 
工 .选项 告诉 编译 器 在 当前 目录 〈.) 中 查找 函数 库 。-lfoo 选 项 告诉 


编译 器 使 用 名 为 libfoo.a 的 函数 库 〈( 或 者 名 为 libfoo.so 的 共享 库 ， 如 果 它 
存在 的 话 ) 。 要 查看 哪些 函数 被 包含 在 目标 文件 、 函 数 库 或 可 执行 文件 
里 ， 你 可 以 使 用 nm 命令 。 如 果 你 查看 program 和 libfoo.a， 你 就 会 看 到 也 
数 库 libfoo.a 中 包含 fred 和 bill 两 个 疯 数 ， 而 program 里 只 包含 函数 bil。 妆 
程序 被 创建 时 ， 它 只 包 舍 函数 库 中 它 实 际 需 要 的 函数 。 虽 然 程 序 中 的 头 
文件 包含 函数 库 中 所 有 函数 的 声明 ， 但 这 并 不 会 将 整个 函数 库 包 含 在 最 
终 的 程序 中 。 

如 果 你 熟悉 Windows 软 件 开发 ， 就 会 发 现 两 者 之 间 有 许多 相似 之 
处 ， 如 表 1-2 所 示 。 


5. KFE 


静态 库 的 一 个 缺点 是 ， 当 你 同时 运行 许多 应 用 程序 并 且 它 们 都 使 用 
来 自 同一 个 函数 库 的 函数 时 ， 内 存 中 束 会 有 同一 函数 的 多 份 副 本 ， 而 且 
aca 自身 中 也 有 多 份 同样 的 副本 。 这 将 消耗 大 量 宝 贵 的 内 存 和 磁 
时 空间 。 

许多 支持 共享 库 的 UNIX 系 统 和 Linux 可 以 克服 上 述 不 足 。 对 共享 库 
及 其 在 不 同系 统 上 实现 方式 的 详细 讨论 超出 了 本 书 的 范围 ， 所 以 我 们 将 
仅 讨 论 Linux 下 的 实现 。 

共享 库 的 保存 位 置 与 静态 库 是 一 样 的 ， 但 共享 库 有 不 同 的 文件 名 后 
级 。 在 一 个 典型 的 Linux 系 统 中 ， 标 准 数学 库 的 共享 版 本 
是 /usr/lib/libm.so。 

当 一 个 程序 使 用 共享 库 时 ， 它 的 链接 方式 是 这 样 的 : 程序 本 身 不 再 
包含 函数 代码 ， 而 是 引用 运行 时 可 访问 的 共享 代码 。 当 编译 好 的 程序 被 
装载 到 内 存 中 执行 时 ， 函 数 引 用 被 解析 并 产生 对 共享 库 的 调用 ， 如 果 有 
必要 ， 共 享 库 才 被 加 载 到 内 存 中 。 

通过 这 种 方法 ， 系 统 可 以 只 保留 共享 库 的 一 份 副 本 供 许多 应 用 程序 
同时 使 用 ， 并 且 在 磁盘 上 也 仅 保 存 一 份 。 另 一 个 好 处 是 共享 库 的 更 新 可 
以 独立 于 依赖 它 的 应 用 程序 。 例 如 ， 文 件 /lib/libm.so 束 是 对 实际 库 文件 
修订 版 本 (lib/llibm.so.N， 其 中 NN 代表 主 版 本 号 ， 在 写作 本 书 时 它 是 6) 
的 符号 链接 。 当 Linux 启 动 应 用 程序 时 ， 它 会 考虑 应 用 程序 需要 的 函数 
库 版 本 ， 以 防止 函数 库 的 新 版 本 致使 旧 的 应 用 程序 不 能 使 用 。 


下 面 例子 的 输出 取 自 SUSE 10.3 发 行 版 ， 如 果 你 使 用 的 不 是 这 
个 发 行 版 ， 输 出 可 能 略 有 不 同 。 


对 Linux 系 统 来 说 ， 负 责 装载 共享 库 并 解析 客户 程序 函数 引用 的 程 
Fe 〈 动 态 装载 器 ) 是 ldt.so， 也 可 能 是 ld-linux.so.2、]1d-lsb.so.2 或 1d- 
lsb.so.3。 用 于 搜索 共享 库 的 额外 位 置 可 以 在 文件 /etc/ld.so.conf 中 配置 ， 
如 果 修 改 了 这 个 文件 ， 你 需要 执行 命令 ldconfig 来 处 理 它 (例如 ， 安 装 
了 X 视 窗 系统 后 需要 添加 X11 共享 库 ) 。 
你 可 以 通过 运行 工具 1dd 来 查看 一 个 程序 需要 的 共享 库 。 例 如 ， 如 
果 你 在 自己 的 示例 程序 上 运行 dd， 你 将 看 到 如 下 所 示 的 输出 结果 : 
$ ldd program 


nyeh7T7AhANN 
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lc 2 (0xb7efc00 


在 本 例 中 ， 你 看 到 标准 C 语 言 函 数 库 dibe) 是 共享 的 〈.so) . fE 
序 需要 的 主 版 本 号 是 6。 其 他 UNIX 系 统 在 访问 共享 库 时 也 会 有 类 似 的 安 
排 ， 详 情 请 参考 你 的 系统 文档 。 

共享 库 在 许多 方面 类 似 于 Windows 中 使 用 的 动态 链接 库 。. ”so 库 对 
应 于 .DLL 文件 ， 它 们 都 是 在 程序 运行 时 加 载 ， 而 .a 库 类 似 于 .LIB 文 件 ， 
它们 都 包含 在 可 执行 程序 中 。 


1.3 获得 帮助 


绝 大 多 数 Linux 系 统 都 为 系统 编程 接口 和 标准 工具 提供 了 很 好 的 文 
档 。 这 是 因为 ， 从 早期 的 UNIX 系 统 开 始 ， 程 序 员 就 被 鼓励 为 他 们 的 应 
用 程序 提供 手册 页 。 这 些 手 册页 都 可 以 通过 电子 形式 获得 ， 有 时 也 会 以 
印刷 品 的 形式 提供 。 

man 命 令 可 用 来 访问 在 线 手册 页 。 这 些 手 册页 在 质量 和 细节 上 千 差 
万 别 。 有 些 可 能 只 是 让 读者 参考 其 他 更 详细 的 文档 ， 而 另外 一 些 则 给 出 
了 一 个 工具 所 文 持 的 所 有 选项 和 命令 的 完整 列表 。 无 论 是 哪 种 情况 ， 手 
册页 都 是 一 个 好 的 起 点 。 

GNU 软 件 和 其 他 一 些 上 自由 软件 还 使 用 名 为 info 的 在 线 文档 系统 。 你 
可 以 通过 专用 程序 info 或 通过 emacs 编 辑 器 中 的 info 命 令 来 在 线 浏览 全 部 
的 文档 。info 系 统 的 优点 是 ， 你 可 以 通过 链接 和 交叉 引用 来 浏览 文档 并 
可 直接 跳 转 到 相关 的 章节 。 对 文档 作者 来 说 ，info 系 统 的 优点 是 它 的 文 
件 可 以 由 排版 印刷 文档 使 用 的 同一 个 源 文件 自动 生成 。 


S 验 手册 页 和 info 
让 我 们 来 看 看 GNU C 语 言 编译 器 (gcc) 的 文档 。 
(1) 首先 查看 手册 页 。 


$ man gcc 


“如 果 你 愿 ， 你 可 以 阅 SR a CEST NE ATS i 息 。 这 个 
el 但 它 只 是 GNU C (和 C++) 整个 文档 中 的 一 小 
部 分 。 

在 阅读 手册 页 时 ， 你 可 以 按 空格 键 读 下 一 页 ， 按 Enter 键 (或 Retumn 
键 ， 如 果 你 的 键盘 上 是 Return 键 的 话 ) 读 下 一 按 q 键 退出 。 

(2) 为 了 获得 更 多 关于 GNU C 的 信息 ， 你 可 以 使 用 info 命 令 。 


$ info gcc 


p "将 看 到 一 个 很 长 的 选项 菜单， 你 :可 以 通过 选择 其 中 的 选项 = 
完全 文本 化 的 文档 中 移动 。 沫 单项 和 层次 化 的 页 面 布 局 允许 你 浏览 很 大 
的 文档 。 如 果 印 在 纸 上 的 话 ，GNU C 的 文档 有 好 几 百 页 之 多 。 

当然 ，info 系 统 也 包含 它 自 己 的 一 个 info 形 式 的 帮助 页 。 如 果 按 下 
Ctrl+H 组 合 键 ， 你 将 看 到 一 些 帮 助 信 息 ， 其 中 包括 一 个 如 何 使 用 info 的 
指南 。info 程 序 在 许多 Linux 的 发 行 版 里 都 有 ， 它 也 可 以 安装 在 其 他 
UNIX 系 统 上 。 
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在 本 章 中 ， 我 们 了 解 了 Linux 程 序 设 计 的 相关 内 容 及 Linux 与 商业 版 
本 UNIX 系 统 的 相同 之 处 。 我 们 介绍 了 UNIX 开 发 者 可 用 的 各 种 各 样 的 编 
程 系统 。 我 们 还 通过 一 个 简单 的 程序 和 函数 库 演 示 了 基本 的 C 语 言 工 
有 具 ， 并 将 其 与 Windows 中 的 对 应 内 容 进行 了 比较 。 
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我 们 在 本 书 的 开始 刚刚 介绍 了 用 C 语 言 进行 Linux 程 序 设计 ， 现 在 
却 要 调转 方向 学 习 编 写 shell 程 序 ， 这 是 为 什么 ”在 其 他 的 一 些 操 作 系 统 
中 ， 命 令 行 界面 只 是 对 图 形 化 界面 的 一 个 补充 。 但 对 于 Linux 而 言 ， 却 
并 非 如 此 。 作 为 Linux 灵 感 来 源 的 UNIX 系 统 最 初 根本 就 没有 图 形 化 界 
面 ， 所 有 的 任务 都 是 通过 命令 行 来 完成 的 。 因 此 ，UNIX 的 命令 行 系统 
得 到 了 很 大 的 发 展 ， 并 且 成 为 一 个 功能 强大 的 系统 。Linux 系 统 沿袭 了 
这 一 特点 ， 许 多 强大 的 功能 都 可 以 从 shell 中 轻松 实现 。 因 为 shell 对 Linux 
是 如 此 的 重要 ， 并 且 对 自动 化 简单 的 任务 非常 有 用 ， 所 以 我 们 认为 应 该 
尽早 介绍 shell 程 序 设计 。 
在 本 章 中 ， 我 们 将 通过 一 些 交 互 性 〈 基 于 屏幕 ) 的 例子 来 向 读者 展 

示 编 写 shell 程 序 时 要 用 到 的 语法 、 结 构 和 命令 。 这 些 内 容 将 成 为 对 shell 
主要 特性 及 其 效果 的 一 个 很 有 用 的 概要 介绍 。 同 时 ， 我 们 也 顺便 介绍 两 
个 在 shell 中 经 常用 到 的 特别 有 用 的 命令 行 工具 : grep 和 find。 在 介绍 grep 
时 ， 我 们 还 将 介绍 正则 表达 式 的 基础 知识 ， 它 在 Linux 的 工具 和 程序 设 
计 语 言 《如 Perl、Ruby 和 PHP) 中 都 有 应 用 。 在 本 章 的 最 后 ， 你 将 学 习 
如 何 编写 一 个 真正 的 脚本 程序 ， 本 书 的 后 续 章 节 里 将 用 C 语 言 对 它 进 行 
重 写 和 扩充 。 本 章 将 介绍 以 下 内 容 : 

什么 是 shell 

基本 思路 

微妙 的 语法 : 变量 、 条 件 判 断 和 程序 控制 


命令 和 命令 的 执行 
here 文 档 

调试 

grep 命 令 和 正则 表达 式 


find 命 令 


BE) 1) Eee) ee 
BA 
as 


因此 ， 无 论 你 是 在 系统 管理 工作 中 正面 对 着 复杂 的 shell 脚 本 ， 或 是 
想 实 现 目 己 最 新 的 了 不 起 “但 其 实 是 非常 简单 ) 的 想法 ， 或 只 是 想 加 快 
完成 一 些 重 复 性 的 任务 ， 本 章 对 你 都 很 适用 。 
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使 用 shel 进 行程 序 设计 的 原因 之 一 是 ， 你 可 以 快速 、 简 单 地 完成 编 
程 。 而 且 ， 即使 是 最 基本 的 Linux 安 装 也 会 提供 一 个 shell。 因 此 ， 如 果 
你 有 一 个 简单 的 构想 ， 则 可 以 通过 它 来 检查 自己 的 想法 是 否 可 行 .shell 也 
非常 适合 于 编写 一 些 执行 相对 简单 的 任务 的 小 工具 ， 因 为 它们 更 强调 的 
是 易于 配置 、 易 于 维护 和 可 移植 性 ， 而 不 是 很 看 重 执行 的 效率 。 你 还 可 
以 使 用 shell 对 进程 控制 进行 组 织 ， 使 命令 按照 预定 顺序 在 前 一 阶段 命令 
成 功 完成 的 前 提 下 顺序 执行 。 

虽然 shell 表 面 上 和 Windows 的 命令 提示 符 相 似 ， 但 是 它 具 备 更 强大 
的 功能 以 完成 相当 复杂 的 程序 。 你 不 仅 可 以 通过 它 执 行 命令 、 调 用 
Linux 工 具 ， 还 可 以 自己 编写 程序 .shell 执 行 shell 程 序 ， 这 些 程序 通常 被 
称 为 脚本 ， 它 们 是 在 运行 时 解释 执行 的 。 这 使 得 调试 工作 比较 容易 进 
行 ， 因 为 你 可 以 逐 行 地 执行 指令 ， 而 且 节 省 了 重新 编译 的 时 间 。 然 而 ， 
这 也 使 得 shell 不 适合 用 来 完成 时 间 紧 过 型 和 处 理 器 忙碌 型 的 任务 。 


2.2 — Ras 


现在 ， 我 们 来 关注 一 点 UNIX (当然 也 是 Linux〉 的 哲学 。UNIX 架 
构 非常 依赖 于 代码 的 高 度 可 重用 性 。 如 果 你 编写 了 一 个 小 巧 而 简单 的 工 
具 ， 其 他 人 就 可 以 将 它 作 为 一 根 链条 上 的 某 个 环节 来 构成 一 条 命令 。 
Linux 让 用 户 满 意 的 原因 之 一 就 是 它 提供 了 各 种 各 样 的 优秀 工具 。 下 面 
是 一 个 简单 的 例子 : 
$ ls -al | more 

这 个 命令 使 用 了 ls 和 more 工 具 并 通过 管道 实现 了 文件 列表 的 分 屏 显 
示 。 每 个 工具 就 是 一 个 组 成 部 件 。 通 常 你 可 以 将 许多 小 巧 的 脚本 程序 组 
合 起 来 以 创建 一 个 庞大 而 复杂 的 程序 。 
mn 例如 ， 如 果 你 想 打 印 bash 使 用 手册 的 参考 副本 ， 可 以 使 用 如 下 命 


X.: 


一 


$ man bash | col -b | lpr 


此 外 ， 因 为 Linux 有 具备 上 自动 文件 类 型 处 理 功 能 ， 所 以 使 用 这 些 工 具 
的 用 户 一 般 不 必 了 解 它们 是 用 哪 种 语言 编写 的 。 如 果 想 要 这 些 工具 运行 
得 更 快 ， 常 见 的 做 法 是 首先 在 shell 中 实现 工具 的 原型 ， 一 旦 确定 值得 这 
么 做 ， 然 后 再 用 C 或 Ct++、Perl、Python 或 者 其 他 执行 得 更 快速 的 语言 来 
重新 实现 它们 。 相 反 ， 如 果 在 shell 中 这 些 工具 工作 得 已 足够 好 ， 就 不 必 
再 重新 实现 它们 。 

是 否 需 要 重新 实现 脚本 程序 取决 于 你 是 否 需 要 对 它 进行 优化 ， 是 否 
需要 将 程序 移植 到 其 他 系统 ， 是 人 否 需要 让 它 更 易于 修改 以 及 它 是 否 偏离 
了 其 最 初 的 设计 目的 〈 这 种 情况 经 常 发 生 ) 。 


如 果 你 对 shell 脚 本 充满 好 奇 ，Linux 系 统 中 已 经 装 有 许多 的 shell 
脚本 例子 ， 包 括 软 件 包 安装 程序 、.xinitrc 和 startx 文 件 以 及 /etcrc.d 
目录 中 用 于 局 动 时 配置 系统 的 脚本 程序 。 


2.3 Z te shell 


在 开始 讨论 如 何 使 用 shell 进 行程 序 设计 之 前 ， 我 们 先 来 回顾 一 下 
shell 的 作用 以 及 Linux 系 统 中 提供 的 各 种 shell。 ”shell 是 一 个 作为 用 户 与 
Linux 系 统 间 接口 的 程序 ， 它 允许 用 户 疝 操作 系统 输入 需要 执行 的 命 
令 。 这 点 与 Windows 的 命令 提示 符 类 似 ， 但 正如 先前 所 提 到 的 ，Linux 
shell 的 功能 更 强大 。 例 如 ， 我 们 可 以 使 用 < 和 > 对 输入 输出 进行 重 定 问 ， 
使 用 I 在 同时 执行 的 程序 之 间 实 现 数据 的 管道 传递 ， 使 用 $$ C. 获取 子 
进程 的 输出 。 在 Linux 中 安装 多 个 shell 是 完全 可 行 的 ， 用 户 可 以 挑选 一 
种 自己 喜欢 的 shell 来 使 用 。 图 2-1 显 示 了 shell (实际 上 是 两 种 shell: bash 
和 csh) 和 其 他 程序 环绕 在 Linux 内 核 的 四 周 。 


图 2-1 


由 于 Linux 是 高 度 模块 化 的 系统 ， 所 以 你 可 以 从 各 种 不 同 的 shell 中 
选择 一 种 来 使 用 ， 虽 然 它 们 中 的 大 多 数 都 是 从 最 初 的 Bourne shel 演变 而 


来 的 。 在 Linux 系 统 中 ， 总 是 作为 /bin/sh 安 装 的 标准 shell 是 GNU 工 具 集 中 
的 bash (GNUBourne-Again Shell) 。 因 为 它 作为 一 个 优秀 的 shell， 总 是 
安装 在 Linux 系 统 上 ， 而 且 它 是 开源 的 并 且 可 以 被 移植 到 几乎 所 有 的 类 
UNIX 系 统 上 ， 所 以 我 们 把 它 作 为 将 要 使 用 的 shell。 在 本 间 中 ， 我 们 将 
使 用 bash 的 第 3 版 ， 并 且 在 大 多 数 情 况 下 只 使 用 那些 所 有 POSIX 兼 容 的 
shell 都 具备 的 功能 。 我 们 假设 bash 被 安装 为 /bin/sh 并 且 它 是 你 的 登录 所 
使 用 的 默认 shell。 在 大 多 数 Linux 发 行 版 中 ， 默 认 的 shell 程 序 bin/sh 实 际 
上 是 对 程序 /bin/bash 的 一 个 连接 。 
你 可 以 使 用 如 下 命令 来 查看 bash 的 版 本 号 : 


$ /bin/bash --version 


own hach q Y 2 Q 1 al mm ee mm q £04 mr ls Is | 
GNU bash, version 3.2.9(1)-release (1686-pc-linux-gnu 


Copyrignt (C) Z2UU5 Free software Foundation, Inc. 


如 果 你 想 要 切换 到 另 一 个 shell (例如 ， bash 不 是 你 的 系统 中 
默认 的 shell) ， 你 只 需 直 接 执行 需要 的 shell 程 序 〈 例 如 ， 
/bin/bash) 就 可 以 运行 新 的 shell 并 且 改 变 命 令 提 示 符 了 。 如 果 你 
使 用 的 是 UNIX 系 统 并 且 bash 没 有 被 安装 ， 你 可 以 从 GNU Web 网 
站 www.gnu.org 上 免费 下 载 它 。 它 的 源 代 码 具 有 高 度 的 可 移植 性 ， 
它 在 你 的 UNIX 版 本 上 编译 成 功 几 乎 不 会 有 什么 问题 。 


当 你 创建 Linux 用 户 时 ， 你 可 以 设置 这 个 用 户 要 使 用 的 shell， 这 个 
工作 既 可 以 在 创建 用 户 时 完成 ， 也 可 以 在 创建 用 户 之 后 ， 通 过 修改 用 户 
言 轧 来 完成 。 图 2-2 显 示 了 使 用 Fedora 选 择 用 户 shell 的 界面 。 


User Manager - OR 


Apply Miter 


图 2-2 


还 有 许多 免费 的 或 商业 的 shell 可 以 使 用 ， 表 2-1 对 常用 的 shell 做 了 一 
个 简单 的 总 结 。 


表 2-1 
shel z Ek HEA 
h (F 3 UNIX ` | 
li C shell A u* Bill Berkele NIX t K 
2 by shell 
iks} k bell F jtag pdksh bc doma hel david Korn tig 
Ç 


shell fi i Hit 


除了 C shell 和 少数 变 体 以 外 ， 所 有 这 些 shell 都 很 相似 ， 并 且 都 与 
X/Open 4. 2 和 POSIX1003. 2 规范 中 对 于 shell 的 规定 非常 一 致 。POSIX 
1003. 2 对 于 shell 的 规定 很 少 ， 但 在 X/Open 中 的 扩展 规定 则 提供 了 一 个 更 
加 友好 、 功 能 更 加 强大 的 shell。 X/Open 通常 是 一 个 提出 更 多 要 求 的 规 
范 ， 但 遵循 它 的 系统 也 更 加 友好 。 


24 管道 和 重 定向 


在 深入 探讨 shell 程 序 设计 的 细节 之 前 ， 我 们 需要 先 介绍 一 下 如 何 才 
能 对 Linux 程 序 〈 不 仅仅 是 shell 程 序 ) 的 输入 输出 进行 重 定向 。 


读者 可 能 已 经 对 某 些 类 型 的 重 定向 比较 熟悉 了 ， 例 如 : 
$ ls -1 > lsoutput.txt 


这 条 命令 把 ls 命令 的 输出 保存 到 文件 lsoutput.txt 中 。 

然而 ， 重 定向 所 包含 的 内 容 可 比 这 个 简单 的 例子 所 显示 的 要 多 得 
多 。 你 将 在 第 3 章 学 习 更 多 关于 标准 文件 描述 符 的 内 容 ， 现 在 你 只 需 知 
道 文件 描述 符 0 代 表 一 个 程序 的 标准 输入 ， 文 件 描述 符 1 代表 标准 输出 ， 
而 文件 描述 符 2 代 表 标 准 错误 输出 。 你 可 以 单独 地 重 定向 其 中 任何 一 
个 。 事 实 上， 你 还 可 以 重 定向 其 他 文件 描述 符 ， 但 对 标准 文件 描述 符 
0、1、2 以 外 的 文件 描述 符 进 行 重 定 同 的 情况 很 少见 。 

上 面 的 例子 通过 > 操作 符 把 标准 输出 重 定 同 到 一 个 文件 。 在 默认 情 
况 下 ， 如 果 该 文件 已 经 存在 ， 它 的 内 容 将 被 窗 盖 。 如 果 你 想 改变 默认 行 
为 ， 你 可 以 使 用 命令 set-o noclobber (或 set-C) 命令 设置 noclobber 选 
项 ， 从 而 阻止 重 定 同 操作 对 一 个 已 有 文件 的 敢 癌 。 你 可 以 使 用 set +o 
ee 
过 项 。 

你 可 以 用 >> 操 作 符 将 输出 内 容 附 加 到 一 个 文件 中 。 例 如 : 
S ps >> lsoutput.txt 
这 条 命令 会 将 ps 命令 的 输出 附加 到 指定 文件 的 尾部 。 

如 果 想 对 标准 错误 输出 进行 重 定 向 ， 你 需要 把 想 要 重 定 同 的 文件 擅 
述 符 编 号 加 在 > 操作 符 的 前 面 。 因 为 标准 错误 输出 的 文件 描述 符 编 号 是 
2， 所 以 使 用 2> 操 作 符 。 当 需要 丢弃 错误 信息 并 阻止 它 显示 在 屏幕 上 

假设 你 想 用 kill 命 令 在 一 个 脚本 程序 里 终止 一 个 进程 ， 那 么 总 是 存 
在 这 种 可 能 性 ， 即 在 kill 命 令 执行 之 前 ， 那 个 需要 终止 的 进程 就 已 经 结 
束 了 。 如 果 出 现 这 种 情况 ，k 记 命令 将 向 标准 错误 输出 写 一 条 错误 信 
居 ， 并 且 在 默认 情况 下 ， 这 条 信息 将 会 显示 在 屏幕 上 。 通 过 对 标准 输出 


和 标准 错误 输出 都 进行 重 定向 ， 你 就 可 以 阻止 kill 命 令 向 屏幕 上 写 任何 
下 面 的 命令 将 把 标准 输出 和 标准 错误 输出 分 别 重 定向 到 不 同 的 文件 
H, 


$ kill -HUP 1234 >killout.txt 2>killerr.txt 


如 果 你 想 把 两 组 输出 都 重 定 同 到 一 个 文件 中 ， 你 可 以 用 >& 操 作 符 
来 结合 两 个 输出 。 如 下 所 示 : 
$ kill -1 1234 >killouterr.txt 2>&1 

这 条 命令 将 把 标准 输出 和 标准 错误 输出 都 重 定 癌 到 同一 个 文件 中 。 
请 注意 操作 符 出 现 的 顺序 。 这 条 命令 的 含义 是 “将 标准 输出 重 定向 到 文 
件 killouterr.txt， 然 后 将 标准 错误 输出 重 定 同 到 与 标准 输出 相同 的 地 
方 。” 如 果 顺 序 有 误 ， 重 定 同 将 不 会 按照 你 预期 的 那样 执行 。 

因为 可 以 通过 返回 码 ( 我 们 将 在 本 章 的 后 面 对 其 进行 详细 介绍 ) 来 
了 解 kill 命 令 的 执行 结果 ， 所 以 通常 并 不 需要 保存 标准 输出 或 标准 错误 
输出 的 内 容 。 你 可 以 用 Linux 的 通用 “回收 站 ”/dev/null 来 有 效 地 丢弃 所 有 
的 输出 信息 ， 如 下 所 示 : 


S kill -1 1234 >/dev/null 2>&1 


你 不 仅 可 以 重 定 同 标 准 输出 ， 还 可 以 重 定 同 标 准 输入 。 例 如 : 
S more < killout.txt 


很 明显 ， 在 Linux 下 这 样 做 意义 不 大 ， 因 为 Linux 的 more 命 令 可 以 接 
受 文件 名 作为 参数 ， 这 与 Windows 命 令 行 中 对 应 的 命令 不 同 。 
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你 可 以 用 管道 操作 符 | 来 连接 进程 。Linux 与 MS-DOS 不 同 ， 在 Linux 
下 通过 管道 连接 的 进程 可 以 同时 和 运行， 并且 随 着 数据 流 在 它们 之 间 的 传 
递 可 以 自动 地 进行 协调 。 举 一 个 简单 的 例子 ， 你 可 以 使 用 Sort 命令 对 ps 
命令 的 输出 进行 排序 。 

如 果 不 使 用 管道 ， 你 就 必须 分 几 个 步骤 来 完成 这 个 任务 ， 如 下 所 
ZN: 


$ ps > psout.txt 
$ sort psout.txt > pssort.out 


一 个 更 精巧 的 解决 方案 是 用 管道 来 连接 进程 ， 如 下 所 示 : 
$ ps | sort > pssort.out 


如 果 想 在 屏幕 上 分 页 显示 输出 结果 ， 你 可 以 再 连接 第 三 个 进程 
more， 将 它们 都 放 在 同一 个 命令 行 上 ， 如 下 所 示 : 


$ ps | sort | more 


允许 连接 的 进程 数目 是 没有 限制 的 。 假 设 你 想 看 看 系统 中 运行 的 所 
有 进程 的 名 字 ， 但 不 包括 shell 本 身 ， 可 以 使 用 下 面 的 命令 : 
$ ps -xo comm | sort | uniq | grep -v sh | more 

这 个 命令 首先 按 字 母 顺 序 排序 ps 命令 的 输出 ， 再 用 uniq 命 令 去 除名 
字 相 同 的 进程 ， 然 后 用 grep -Vsh 命 令 删 除名 为 sh 的 进程 ， 最 终 将 结果 分 
页 显示 在 屏幕 上 。 

如 你 所 见 ， 与 使 用 一 系列 单独 的 命令 并 且 每 个 命令 都 带 有 自己 的 临 
时 文件 相 比 ， 这 是 一 个 更 精巧 的 解决 方案 。 但 这 里 有 一 点 需 要 引起 注 
me: 如 果 你 有 一 系列 的 命令 需要 执行 ， 相 应 的 输出 文件 是 在 这 一 组 命令 
被 创建 的 同时 立刻 被 创建 或 写 入 的 ， 所 以 决 不 要 在 命令 流 中 重复 使 用 相 
同 的 文件 名 。 如 果 你 尝试 执行 如 下 命令 : 


cat mydata.txt | sort | unig > mydata.txt 


你 最 终 将 得 到 一 个 空 文件 ， 因 为 你 在 读 取 文 件 mydata.txt 之 前 就 已 经 覆 
m SIRS SCTE A Zo 


现在 你 已 了 解 了 一 些 基 本 的 shell 操 作 ， 和 是 时 候 开 始 介绍 一 些 真正 的 
shell 脚 本 程序 了 。 编 写 shell 脚 本 程序 有 两 种 方式 。 你 可 以 输入 一 系列 命 
令 让 shell 交 互 地 执行 它们 ， 也 可 以 把 这 些 命 令 保 存 到 一 个 文件 中 ， 然 后 
将 该 文件 作为 一 个 程序 来 调用 。 


2.5.1 交互 式 程序 


在 命令 行 上 直接 输入 shel 脚 本 是 一 种 测试 短小 代码 段 的 简单 而 快捷 
的 方式 。 如 果 你 正在 学 习 shell 脚 本 或 仅仅 是 为 了 进行 测试 ， 使 用 这 种 方 
式 是 非常 有 用 的 。 
假设 你 想 要 从 大 量 C 语 言 源 文件 中 查找 包含 字符 串 POSIX 的 文件 。 
与 其 使 用 grep 命 令 在 每 个 文件 中 搜索 字符 串 ， 然 后 再 分 别 列 出 包含 该 字 
符 串 的 文件 ， 不 如 用 下 面 的 交互 式 脚 本 来 执行 整个 操作 : 
$ for file in * 
> do 
> if grep -l POSIX $file 
> then 
> more $file 
> fi 
> done 


Dos 
eas 


This is a file with POSIX in it treat it well 


请 注意 ， 当 shell 期 待 进一步 的 输入 时 ， 正 常 的 $shell 提 示 符 将 改变 
为 > 提示 符 。 你 可 以 一 直 输 入 下 去 ， 由 shell 来 判断 何 时 输入 完毕 并 立刻 
执行 脚本 程序 。 

在 这 个 例子 中 ，grep 命 令 输出 它 找到 的 包含 POSIX 字 符 串 的 文件 ， 
然后 more 命 令 将 文件 的 内 容 显 示 在 屏 间 上。 最后， 返回 shell 提 示 符 。 还 
要 注意 的 是 ， 你 用 shell 变 量 来 处 理 每 个 文件 ， 以 使 该 脚本 自 文档 化 。 你 
也 可 以 将 变量 名 起 为 1， 但 是 变量 名 他 e 更 容易 理解 。 

shell 还 提供 了 通配符 扩展 〈 通 常 称 为 globbing) 。 你 一 定 已 注意 到 
可 以 用 通配符 ?来 匹配 一 个 字符 串 。 但 是 你 可 能 不 知道 可 以 用 通配符 ? 
来 匹配 单个 字符 ， 而 [sed 允许 匹 配方 括号 中 任何 一 个 单个 字符 ，[set 对 
方 括号 中 的 内 容 取 反 ， 即 匹配 任何 没有 出 现在 给 出 的 字符 集中 的 字符 。 
扩展 的 花 括 号 {} (只 能 用 在 部 分 shell 中 ， 其 中 包括 bash)〉 允许 你 将 任意 


的 字符 串 组 放 在 一 个 集合 中 ， 以 供 shell 进 行 扩 展 。 例 如 : 
S ls my_{finger,toe}s 


这 个 命令 将 列 出 文件 my_fingers 和 my_toes， 它 使 用 shell 来 检查 当前 目录 
下 的 每 个 文件 。 当 我 们 在 本 章 结尾 详细 介绍 grep 命 令 和 正则 表达 式 的 强 
大 功能 时 ， 我 们 将 回 过 头 来 再 次 研究 匹配 模式 中 的 这 些 规则 。 

有 经 验 的 Linux 用 户 可 能 会 用 一 种 更 有 效 的 方式 来 执行 这 个 简单 的 
操作 。 也 许 使 用 如 下 的 命令 : 


$ more ‘grep -l1 POSIX *` 
或 使 用 功能 相同 的 男 一 种 命令 形式 : 
$ more $(grep -l POSIX *) 
此 外 ， 下 面 的 命令 将 输出 包含 POSIX 字 符 串 的 文件 名 : 
$ grep -1 POSIX * | more 


在 上 面 的 脚本 中 ， 你 看 到 shell] 利 用 其 他 命令 〈 如 grep 和 more) KE 
成 主要 的 工作 .shell 本 喘 只 是 允许 你 将 几 个 现 有 的 命令 结合 在 一 起 ， 以 构 
成 一 个 新 的 功能 强大 的 命令 。 你 将 在 后 面 的 脚本 示例 中 看 到 通配符 扩展 
的 多 次 应 用 ， 并 且 我 们 还 将 在 本 章 中 介绍 grep 命 令 和 正则 表达 式 时 详细 
讨论 整个 扩展 的 细节 。 

如 果 每 次 想 要 执行 一 系列 命令 时 ， 你 都 要 经 过 这 么 一 个 见长 的 输入 
过 程 ， 将 非常 令 人 烦恼 。 你 需要 将 这 些 命令 保存 到 一 个 文件 中 ， 即 我 们 
党 说 的 shell 脚 本 ， 这 样 你 就 可 以 在 需要 的 时 候 随 时 执行 它们 了 。 


2.5.2 创建 脚本 


首先 ， 你 必须 用 一 个 文本 编辑 器 来 创建 一 个 包含 命令 的 文件 ， 将 其 
命名 为 first， 它 的 内 容 如 下 所 示 : 


程序 中 的 注释 以 # 符 号 开始 ， 一 直 持 续 到 该 行 的 结束 。 按 照 惯例 ， 
我 们 通常 把 # 放 在 第 一 列 。 在 作出 这 样 一 个 算 统 的 陈述 之 后 ， 请 注意 第 
一 行 #!/bin/sh， 它 是 一 种 特殊 形式 的 注释 ，#1! 字符 告诉 系统 同一 行 上 紧 
跟 在 它 后 面 的 那个 参数 是 用 来 执行 本 文件 的 程序 。 在 这 个 例子 
中 ，/bin/sh 是 默认 的 shell 程 序 。 


请 注意 注释 中 使 用 的 是 绝对 路 径 。 考 虑 到 问 后 兼容 性 ， 这 个 路 
径 按 惯例 最 好 不 要 超过 32 个 字符 ， 因 为 一 些 老 版 本 的 UNIX 在 使 用 # 
is 
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因为 脚本 程序 本 质 上 被 看 作 是 shell 的 标准 输入 ， 所 以 它 可 以 包含 任 
何 能 够 通过 你 的 PATH 环境 变量 引用 到 的 Linux 命 令 。 

exit 命 令 的 作用 是 确保 脚本 程序 能 够 返回 一 个 有 意义 的 退出 码 〈 在 
本 章 的 后 面 将 对 此 进行 详细 介绍 ) 。 当 程序 以 交互 方式 运行 时 ， 我 们 很 
少 需 要 检查 它 的 退出 码 ， 但 如 果 你 打算 从 另 一 个 脚本 程序 里 调用 这 个 脚 
本 程序 并 查看 它 是 否 执行 成 功 ， 那 么 返回 一 个 适当 的 退出 码 就 很 重要 
了 。 即 使 你 从 来 也 没 打 算 允 许 你 的 脚本 程序 被 男 一 个 脚本 程序 调用 ， 你 
也 应 该 在 退出 时 返回 一 个 合理 的 退出 码 。 请 相信 自己 的 脚本 程序 是 有 用 
的 ， 它 总 有 一 天 会 作为 其 他 脚本 程序 的 一 部 分 而 被 重用 。 

在 shell 程 序 设计 里 ，0 表 示 成 功 。 因 为 这 个 脚本 程序 并 不 能 检查 到 
任何 错误 ， 所 以 它 总 是 返回 一 个 表示 成 功 的 退出 码 。 我 们 将 在 本 章 后 面 
详细 介绍 exit 命 令 时 ， 再 回 过 头 来 解释 用 0 表示 成 功 的 原因 。 

请 注意 ， 这 个 脚本 没有 使 用 任何 的 文件 扩展 名 或 后 级 。 一 般 情 况 
下 ，Linux 和 UNIX 很 少 利 用 文件 扩展 名 来 决定 文件 的 类 型 。 你 可 以 为 脚 
本 使 用 .sh 或 者 其 他 扩展 名 ,但 shell 并 不 关心 这 一 点 。 大 多 数 预 安装 的 脚 
本 程序 并 没有 使 用 任何 文件 扩展 名 ， 检 查 这 些 文件 是 否 是 脚本 程序 的 最 
好 方法 是 使 用 file 命 令 ， 例 如 ，file first 或 fle /bin/bash。 你 可 以 使 用 任何 
适用 于 你 的 工作 环境 或 适合 于 你 的 方式 。 


一 


2.5.3 却 本 设置 为 6 
现在 你 已 经 有 了 自己 的 脚本 文件 ， 运 行 它 有 两 种 方法 。 比 较 简单 的 
方法 是 调用 shell， 并 把 脚本 文件 名 当成 一 个 参数 ， 如 下 所 示 : 
S /bin/sh first 
这 可 以 工作 ， 但 如 果 能 像 对 待 其 他 Linux 命 令 那样 ， 只 输入 脚本 程 
序 的 名 字 就 可 以 调用 它 就 更 好 了 。 你 可 以 使 用 chmod 命 令 来 改变 这 个 文 
件 的 模式 ， 使 得 这 个 文件 可 以 被 所 有 用 户 执 行 ， 如 下 所 示 : 
S chmod +x first 


当然 ， 这 并 不 是 使 用 chmod 命 令 将 一 个 文件 设置 为 可 执行 的 
唯一 方式 ， 请 用 man ” chmod 命令 查看 它 的 八进制 参数 和 其 他 选项 


然后 你 可 以 用 下 面 的 命令 来 执行 它 : 
S first 


你 可 能 会 看 到 一 条 错误 信息 告诉 你 未 找到 命令 。 这 种 情况 很 可 能 发 
生 ， 因 为 shel 环 境 变量 PATH 并 没有 被 设置 为 在 当前 目录 下 和 查找 要 执行 
的 命令 。 要 解决 这 个 问题 ， 一 种 办 法 是 在 命令 行 上 直接 输入 命令 
PATH=$PATH:. 或 编辑 你 的 。bash_profile 文 件 ， 将 刚才 这 条 命令 添加 到 
文件 的 末尾 ， 然 后 退出 登录 后 再 重新 登录 进来 。 另 外 ， 你 也 可 以 在 保存 
脚本 程序 的 目录 中 输入 命令 。/first， 该 命令 的 作用 是 把 脚本 程序 的 完整 
的 相对 路 径 告 诉 shell。 

用 .来 指定 路 径 还 有 另 一 个 好 处 ， 它 能 够 保证 你 不 会 意外 执行 系统 
中 与 你 的 脚本 文件 同名 的 另 一 个 命令 。 


你 不 应 该 用 这 种 方法 来 修改 超级 用 户 ( 一 般 其 用 户 名 为 
root) 的 PATH 变量 。 这 是 一 个 安全 方面 的 漏洞 ， 因 为 以 root 用 户 
身份 登录 的 系统 管理 员 可 能 会 因此 误 调 用 了 某 个 标准 命令 的 伪装 
版 本 。 本 书 其 中 一 位 作者 就 曾经 这 样 做 过 一 次 ， 目 的 当然 是 为 了 
回 系 统管 理 员 指 出 这 一 点 ! 即使 对 于 普通 用 户 ， 把 当前 目录 包括 
在 PATH 变量 中 也 多 少 有 些 危 险 。 因 此 ， 如 果 你 非常 关心 系统 的 


安全 ， 最 好 的 办 法 是 养 成 在 执行 当前 目录 中 的 所 有 命令 时 ， 在 其 
前 面 都 加 上 一 个 ./ 的 好 习惯 。 


在 确信 你 的 脚本 程序 能 够 正确 执行 后 ， 你 可 以 把 它 从 当前 目录 移 到 
一 个 更 合适 的 地 方 去 。 如 果 这 个 命令 只 供 你 本 人 使 用 ， 你 可 以 在 自己 的 
家 目录 中 创建 一 个 bin 目 录 ， 并 且 将 该 目录 添加 到 你 上 自己 的 PATH 变量 
中 。 如 果 你 想 让 其 他 人 也 能 够 执行 这 个 脚本 程序 ， 你 可 以 
将 /asvlocalbin 或 其 他 系统 目录 作为 添加 新 程序 的 适当 位 置 。 如 采 你 在 
系统 上 没有 root 权 限 ， 你 可 以 要 求 系统 管理 员 帮 你 复制 你 的 文件 ， 当 然 
你 首先 必须 让 他 们 相信 这 些 程序 的 价值 才 行 。 为 了 防止 其 他 用 户 修改 脚 
本 程序 ， 哪 怕 只 是 意外 地 修改 ， 你 也 应 该 去 掉 脚 本 程序 的 写 权 限 。 系 统 
管理 员 用 来 设置 文件 属 主 和 访问 权限 的 一 系列 命令 如 下 所 示 : 
# cp first /usr/local/bin 
# chown root /usr/local/bin/first 
# chgrp root /usr/local/bin/first 
# chmod 755 /usr/local/bin/first 
注意 ， 你 在 这 里 不 是 修改 访问 权限 标志 的 特定 部 分 ， 而 是 使 用 
chmod 命 令 的 绝对 格式 ， 因 为 你 清楚 地 知道 你 需要 的 访问 权限 。 
如 果 你 愿意 ， 还 可 以 使 用 chmod 命 令 相 对 长 一 些 但 可 能 含义 更 明确 
的 格式 ， 如 下 所 示 : 


# chmod u=rwx,go=rx /usr/local/bin/first 


更 多 chmod 命 令 的 详细 资料 请 参考 它 的 使 用 手册 。 


在 Linux 系 统 中 ， 如 果 你 拥有 包含 条 个 文件 的 目录 的 写 权 限 ， 
就 可 以 删除 这 个 文件 。 为 安全 起 见 ， 应 该 确保 只 有 超级 用 户 才能 
对 你 想 保 证 文件 安全 的 目录 执行 写 操作 。 因 为 目录 只 是 男 一 种 类 
型 的 文件 ， 所 以 拥有 对 一 个 目录 文件 写 权 限 的 用 户 可 以 添加 和 删 
除 目 录 文 件 中 的 名 称 。 


2.6 ”shell 的 语法 


现在 你 已 看 过 一 个 简单 的 shell 程 序 示例 ， 是 时 候 来 深入 研究 Shell 强 
大 的 程序 设计 能 力 了 .shell 是 一 种 很 容易 学 习 的 程序 设计 语言 ， 它 可 以 在 
把 各 个 小 程序 段 组 合 为 一 个 大 程序 之 前 束 能 很 容易 地 对 它们 分 别 进行 交 
互 式 的 测试 。 你 还 可 以 用 bash shell 编 写 出 相当 庞大 的 结构 化 程序 。 在 接 
下 来 的 几 节 里 ， 我 们 将 学 习 以 下 内 容 : 
变量 : 字符 串 、 数 字 、 环 境 和 参数 
条 件 : shell 中 的 布尔 值 
程序 控制 : if、elif、for、while、until、case 
命令 列表 
函数 
shell 内 置 命令 
获取 命令 的 执行 结果 
here 文 档 


2.6.1 变量 


在 shell 里 ， 使 用 变量 之 前 通常 并 不 需要 事先 为 它们 做 出 声明 。 你 只 
是 通过 使 用 它们 《比如 当 你 给 它们 赋 初 始 值 时 ) 来 创建 它们 。 在 默认 情 
况 下 ， 所 有 变量 都 被 看 作 字 符 串 并 以 字符 串 来 存储 ， 即 使 它们 被 赋值 为 
数值 时 也 是 如 此 .shell 和 一 些 工具 程序 会 在 需要 时 把 数值 型 字符 串 转换 为 
对 应 的 数值 以 对 它们 进行 操作 。Linux 是 一 个 区 分 大 小 写 的 系统 ， 因 此 
shell 认 为 变量 foo 与 Foo 是 不 同 的 ， 而 这 两 者 与 Foo 又 是 不 同 的 。 

在 shell 中 ， 你 可 以 通过 在 变量 名 前 加 一 个 $ 符 号 来 访问 它 的 内 容 。 
无 论 何 时 你 想 要 获取 变量 内 容 ， 你 都 必须 在 它 前 面 加 一 个 $ 字 符 。 当 你 
为 变量 赋值 时 ， 你 只 需要 使 用 变量 名 ， 该 变量 会 根据 需要 被 自动 创建 。 
一 种 检查 变量 内 容 的 简单 方式 就 是 在 变量 名 前 加 一 个 $ 符 号 ， 再 用 echo 
命令 将 它 的 内 容 输出 到 终端 上 。 

在 命令 行 上 ， 你 可 以 通过 设置 和 检查 变量 salutation 的 不 同 值 来 实际 
查看 变量 的 使 用 : 


口 口 口 口 口 口 口 口 


$ salutation=Hello 

$ echo $salutation 
Hello 

$ salutation="Yes Dear" 
$ echo $salutation 

Yes Dear 

S salutation=7+5 


$ echo $salutation 
7+5 


ER, WARS PR ASA, MOA S| SIE Ete 
来 。 此 外 ， 等 号 两 边 不 能 有 空格 。 


你 可 以 使 用 read 命 令 将 用 户 的 输入 赋值 给 一 个 变量 。 这 个 命令 需要 


一 个 参数 ， 即 准备 读 入 用 户 输入 数据 的 变量 名 ， 然 后 它 会 等 竺 用 户 输入 
数据 。 通 羊 情况 下 ， 在 用 户 按 下 回 车 键 时 ，read 命 令 结束 。 当 从 终端 上 
读 取 一 个 变量 时 ， 你 一 般 不 需要 使 用 引号 ， 如 下 所 示 : 


格 、 


$ read salutation 
Wie geht's? 
S echo $salutation 
Wie geht's? 


1. 使 用 引号 
在 继续 学 习 之 前 ， 你 先 需 要 弄 清楚 shell 的 一 个 特点 : 引号 的 使 用 。 


一 般 情 况 下 ， 脚 本 文件 中 的 参数 以 空白 字符 分 阳 例如， 一 个 空 
一 个 制 表 符 或 者 一 个 换行 符 ) 。 如 果 你 想 在 一 个 参数 中 包含 一 个 或 


多 个 空白 字符 ， 你 就 必须 给 参数 加 上 引号 。 


像 $foo 这 样 的 变量 在 引号 中 的 行为 取决 于 你 所 使 用 的 引号 类 型 。 如 


末 你 把 一 个 $ 变 量 表达 式 放 在 双 引 号 中 ， 程 序 执行 到 这 一 行 时 就 会 把 变 
量 奉 换 为 它 的 值 ， 如 果 你 把 它 放 在 单 引 写 中 ， 束 不 会 及 生 丛 换 现象 。 你 
还 可 以 通过 在 $ 字 符 前 面 加 上 一 个 \ 学 符 以 取消 它 的 特殊 含义 。 


字符 串通 党 都 极 放 在 双 引 号 中 ， 以 防止 变量 被 空白 字符 分 开 ， 同 时 


又 允许 $ 扩 展 。 


X 验 变量 的 使 用 
这 个 例子 显示 了 引号 在 变量 输出 中 的 作用 : 


echo Enter 


输出 结果 如 下 : 


$ ./variable 

Hi there 

Hi there 

Smyvar 

Smyvar 

Enter some text 
Hello World 


Smyvar now equals Hello World 


实验 解析 

变量 myvar 在 创建 时 被 赋值 字符 串 Hi there。 你 用 echo 命 令 显 示 该 变 
量 的 内 容 ， 同 时 显示 了 在 变量 名 前 加 一 个 $ 符 号 就 能 得 到 变量 的 内 容 。 
你 看 到 使 用 双 引 号 并 不 影响 变量 的 蔡 换 ， 但 使 用 单 引号 和 反 笠 线 就 不 进 
行 变 量 的 蔡 换 。 你 还 使 用 read 命 令 从 用 户 那 里 读 入 一 个 字符 串 。 


2. 环境 变量 


当 一 个 shell 脚 本 程序 开始 执行 时 ， 一 些 变量 会 根据 环境 设置 中 的 值 
进行 初始 化 。 这 些 变 量 通 常用 大 写字 母 做 名 字 ， 以 便 把 它们 和 用 户 在 肢 
本 程序 里 定义 的 变量 区 分 开 来 ， 后 者 按 惯 例 都 用 小 写字 母 做 名 字 。 具 体 
创建 的 变量 取决 于 你 的 个 人 配置 。 在 系统 的 使 用 手册 中 列 出 了 许多 这 样 
的 环境 变量 ， 表 2-2 列 出 了 其 中 一 些 主要 的 变量 。 


表 2-2 


环境 变量 说 A 


if ix 
uN JHRMKAaOMHA 
k4 党 是 5 字符 , Mikbash. f et AE eT. OM te 
tit RUAM. Ci) LBKRISWHRE. HRUNA 
i * 后 续 的 输 》 是 > 
输入 shell 读 上 取 输 入 时 y 5 við r 
er 
shel 
传道 给 Pt 
shel WARE MS AJH 


如 果 想 通过 执行 env <command> 命 令 来 查看 程序 在 不 同 环境 
下 是 如 何 工 作 的 ， 请 查阅 env 命 令 的 使 用 手册 。 你 也 将 在 本 章 的 后 
面 看 到 如 何 使 用 export 命 令 在 子 shell 中 设置 环境 变量 。 


3. 参数 变量 


如 果 脚 本 程序 在 调用 时 融 有 参数 ， 一 些 额 外 的 变量 就 会 被 创建 。 即 
使 没有 传递 任何 参数 ， 环 境 变 量 几 也 依然 存在 ， 只 不 过 它 的 值 是 0 器 
i 


参数 变量 见 表 2-3。 


罗 本 程序 的 参数 
P er 到 出 所 有 的 参数 , APRS ey b 的 第 个 学 符 分 天 tgi 


ma BST 过 不 全 


通过 下 面 的 例子 ， 你 可 以 很 容 


地 看 出 $4@ 和 $* 之 间 的 区 别 : 


$ IFS='' 

$ set foo bar bam 
$ echo "$e" 

foo bar bam 

$ echo "$*" 
foobarbam 

$ unset IFS 

$ echo "$*" 

foo bar bam 


如 你 所 见 ， 双 引号 里 面 的 $@ 把 各 个 参数 扩展 为 彼此 分 开 的 域 ， 而 
不 受 IFS 值 的 影响 。 一 般 来 次 ， 如 有 果 你 想 访 问 脚本 程序 的 参数 ， 使 用 $@ 
征明 智 的 选择 。 

i E E 
它们 。 


实 验 使 用 参数 和 环境 变量 

下 面 的 脚本 程序 演示 了 一 些 简单 的 变量 操作 。 当 输入 脚本 程序 的 内 
容 并 把 它 保 存 为 文件 try_var 后 ， 别 忘 了 用 chmod +x try_var 命 令 把 它 设置 
为 可 执行 。 


echo əsäiutation 
echo "The script iz now complete’ 


运行 这 个 脚本 程序 ， 你 将 得 到 如 下 所 示 的 输出 结果 : 


$ ./try_var foo bar baz 


The program ./try_var is now running 
The second parameter was bar 
The first parameter was foo 


he parameter list was foo bar baz 


The user's home directory is /home/rick 
Please enter a new greeting 

Sire 

Sire 


The script is now complete 


实验 解析 

这 个 脚本 程序 创建 变量 salutation 并 显示 它 的 内 容 ， 然 后 显示 各 种 参 
数 变量 以 及 环境 变量 SHOME 都 已 存在 并 有 了 适当 的 什 。 

我 们 将 在 后 面 进一步 介绍 参数 蔡 换 。 


2.6.2 条 件 


所 有 程序 设计 语言 的 基础 是 对 条 件 进行 测试 判断 ， 并 根据 测试 结 
采取 不 同行 动 的 能 力 。 在 讨论 它 之 前 ， 我 们 先 来 看 看 在 shell 脚 本 程序 里 
可 以 使 用 的 条 件 结构 ， 然 后 再 来 看 看 使 用 这 些 条 件 的 控制 结构 。 

一 个 shell 脚 本 能 够 对 任何 可 以 从 命令 行 上 调用 的 命令 的 退出 码 进 行 
测试 ， 其 中 也 包括 你 自己 编写 的 脚本 程序 。 这 也 就 是 为 什么 要 在 所 有 自 
己 编写 的 脚本 程序 的 结尾 包括 一 条 返回 值 的 exit 命 令 的 重要 原因 。 

test 或 [命令 

在 实际 工作 中 ， 大 多 数 脚 本 程序 都 会 广泛 使 用 shell 的 布尔 判断 命令 
[或 test。 在 一 些 系统 上 ， 这 两 个 命令 的 作用 是 一 样 的 ， 只 是 为 了 增强 可 
该 性 ， 当 使 用 [命令 时 ， 我 们 还 使 用 符号 ] 来 结尾 。 把 [符号 当 作 一 条 命令 
多 少 有 点 奇怪 ， 但 它 在 代码 中 确实 会 使 命令 的 语法 看 起 来 更 简单 、 更 明 
确 、 更 像 其 他 的 程序 设计 语言 。 


在 一 些 老 版 本 的 UNIX shell 中 ， 这 些 命令 调用 的 是 一 个 外 部 程 
序 ， 但 在 较 新 的 shell 版 本 中 ， 它 们 已 成 为 shell 的 内 置 命 令 。 我 们 
将 在 本 章 后 面 介 绍 各 种 命令 时 再 次 讨论 这 个 问题 。 


因为 test 命 令 在 shell 脚 本 程序 以 外 用 得 很 少 ， 所 以 那些 很 少 纺 
写 shell 脚 本 的 Linux 用 户 往往 会 将 自己 编写 的 简单 程序 命名 为 

test。 如 果 程 序 不 能 正常 工作 ， 很 可 能 是 因为 它 与 shell 中 的 test 命 
令 发 生 了 冲突 。 要 想 查看 系统 中 是 否 有 一 个 指定 名 称 的 外 部 命 
令 ， 你 可 以 尝试 使 用 which test 这 样 的 命令 来 检查 执行 的 是 哪 一 个 
test 命 令 ， 或 者 使 用 .test 这 种 执行 方式 以 确保 你 执行 的 是 当前 目录 
PENARE. MERER, MR RESERBA AKONT E 
习惯 即 可 。 


我 们 以 一 个 最 简单 的 条 件 为 例 来 介绍 test 命 令 的 用 法 : 检查 一 个 文 
件 是 否 存 在 。 用 于 实现 这 一 操作 的 命令 是 test -f <filename>， 所 以 在 脚本 
程序 里 ， 你 可 以 写 出 如 下 所 示 的 代码 : 


你 还 可 以 写成 下 面 这 样 : 


f fred.c 


test 命 令 的 退出 码 《〈 表 明 条 件 是 否 被 满足 ) 决定 是 否 需 要 执行 后 面 
的 条 件 代码 。 


注意 ， 你 必须 在 [符号 和 被 检查 的 条 件 之 间 留 出 空格 。 要 记 住 
这 一 点 ， 你 可 以 把 [符号 看 作 和 test 命 令 一 ， 而 test 命 令 之 后 总 是 应 
BATE. 

如 果 你 喜欢 把 then 和 证 放 在 同一 行 上 ， 束 必须 要 用 一 个 分 号 把 
test 语 句 和 then 分 隔 开 。 如 下 所 示 : 


if { -f fred.c ]; then 


fi 
test 命 令 可 以 使 用 的 条 件 类 型 可 以 归 为 3 类 : FREE EA E 


De 关 的 条 件 测试 ， 表 2-4、 表 2-5 和 表 2-6 描 述 了 这 3 种 条 件 类 


# 2-4 
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# 2-5 
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m 一 or TE 
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# 2-6 
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f ‘ tA 个 日 录 则 结果 为 真 
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EUR Tax LAN 
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wN Ba 
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读者 可 能 想 知道 什么 是 set-group-id 和 set-user-id 〈 也 叫做 set- 
gid 和 setruid) 位 。set-uid 位 授予 了 程序 其 拥有 者 的 访问 权限 而 不 
在 其 使 用 首 的 访问 权限 ， 而 set-gid 位 授 子 了 程序 其 所 在 组 的 访问 
权限 。 这 两 个 特殊 位 是 通过 chmod 命 令 令 的 选项 s 和 8 设置 的 。set-gid 
和 set-uid 标 志 对 shell 脚 本 程序 不 起 作用 ， 它 们 只 对 可 执行 的 二 进 
制 文件 有 用 。 


我 们 稍微 超前 了 一 些 ， 但 是 接 下 来 的 测试 bin/bash 文 件 状态 的 例子 
可 以 让 你 看 出 如 何 使 用 它们 : 


各 种 与 文件 有 关 的 条 件 测试 的 结果 为 真 的 前 提 是 文件 必须 存在 。 上 
述 列表 仅仅 列 出 了 test 命 令 比较 常用 的 选项 ， 完 整 的 选项 清单 请 查阅 它 
的 使 用 手册 。 如 果 你 使 用 的 是 bash， 那 么 test 命 令 是 shell 的 内 置 命令 ， 使 
用 help test 命 令 可 以 获得 test 命 令 更 详细 的 信息 。 我 们 将 在 本 章 后 面 用 到 
这 里 给 出 的 部 分 选项 。 

现在 你 已 学 习 了 “条 件 "， 下 面 你 将 看 到 使 用 它们 的 控制 结构 。 


2.6.3 ”控制 结 枚 
shell 有 一 组 控制 结构 ， 它 们 与 其 他 程序 设计 语言 中 的 控制 结构 很 相 


在 下 面 的 各 小 节 中 ， 各 语句 的 语法 中 的 statements 表 示 
when、while 或 until 测 试 条 件 满足 时 ， 将 要 执行 的 一 系列 命令 。 


1. 语句 


这 语句 非常 简单 ， 它 对 某 个 命令 的 执行 结果 进行 测试 ， 然 后 根据 测 
试 结果 有 条 件 地 执行 一 组 语句 。 如 下 所 示 : 


if ji 
then 


else 


fi 
实 验 使 用 证 语句 


这 语句 的 一 个 常见 用 法 是 提 一 个 问题 ， 然 后 根据 回答 作出 决定 ， 如 
BATA: 


这 将 给 出 如 下 所 示 的 输出 : 
Is it morning? Please answer yes or no 
yes 


这 个 脚本 程序 用 [命令 对 变量 timeofday 的 内 容 进 行 测试 ， 测 试 结果 
由 让 命 令 判 断 ， 由 它 来 决定 执行 哪 部 分 代码 。 


请 注意 ， 你 用 额外 的 空白 符 来 缩 进 if 结 构 内 部 的 语句 。 这 只 是 
为 了 照顾 人 们 的 阅读 习惯 ，shell 会 忽略 这 些 多 余 的 空白 符 。 


2. elifi=*) 


遗憾 的 是 ， 上 面 这 个 非常 简单 的 脚本 程序 存在 儿 个 问题 。 其 中 一 个 
问题 是 ， 它 会 把 所 有 不 是 yes 的 回答 都 看 做 是 no。 你 可 以 通过 使 用 elif 结 
构 来 避免 出 现 这 样 的 情况 ， 它 允许 你 在 和 f 结 构 的 else 部 分 被 执行 时 增加 第 
二 个 检查 条 件 。 


X 验 用 elif 结 构 做 进一步 检查 

你 可 以 对 上 面 的 脚本 程序 做 些 修改 ， 让 它 在 用 户 输入 yes 或 no 以 外 
的 其 他 任何 数据 时 报告 一 条 出 错 信 息 。 这 是 通过 将 else 蔡 换 为 elif 并 且 增 
加 另 一 个 测试 条 件 的 方法 来 完成 的 。 


实验 解析 

这 个 脚本 程序 与 上 一 个 例子 很 相似 ， 但 新 增 的 elif 命 令 会 在 第 一 个 让 
条 件 不 满足 的 情况 下 进一步 测试 变量 。 如 果 两 次 测试 的 结果 都 不 成 功 ， 
就 打印 一 条 出 错 信息 并 以 1 为 退出 码 结束 脚本 程序 ， 调 用 者 可 以 在 调用 
程序 中 利用 这 个 退出 码 来 检查 脚本 程序 是 否 执行 成 功 。 


3. 一 个 与 变量 有 关 的 问题 

刚才 所 做 的 修改 弥补 了 一 个 非常 明显 的 缺陷 ， 但 这 个 脚本 程序 还 洪 
藏 着 一 个 更 隐蔽 的 问题 。 运 行 这 个 新 的 脚本 程序 ， 但 是 这 次 不 回答 问 
题 ， 而 是 直接 按 下 回 车 键 〈 或 是 某 些 键盘 上 的 Return 键 )》 。 你 将 看 到 如 
下 所 示 的 出 错 信息 ; 
[: =: unary operator expected 

哪里 出 问题 了 呢 ? 问题 就 在 第 一 个 让 语 名 中 。 在 对 变量 timeofday 进 
行 测试 的 时 候 ， 它 包含 一 个 空 字 符 串 ， 这 使 得 让 语句 成 为 下 面 这 个 样 
子 : 


1f [| = *yes" ] 
而 这 不 是 一 个 合法 的 条 件 。 为 了 避免 出 现 这 种 情况 ， 你 必须 给 变量 加 上 
引号 ， 如 下 所 示 : 


if | "“Stimeofday" = "yes" ] 
这 样 ， 一 个 空 变 量 提供 的 就 是 一 个 合法 的 测试 了 : 
a [ ne “一 "ves" ] 


新 脚本 程序 如 下 所 示 : 


这 个 脚本 对 用 户 直 接 按 下 回 车 键 来 回答 问题 的 情况 也 能 够 应 付 目 如 


如 果 你 想 让 echo 命 令 去 挥 每 一 行 后 面 的 换行 符 ， 可 移植 性 最 
好 的 办 法 是 使 用 printf 命 令 〈 请 见 本 章 后 面 的 printf 一 节 ) 而 不 是 
echo 命 令 。 有 的 shell 用 echo-e 命 令 来 完成 这 一 任务 ， 但 并 不 是 所 有 
的 系统 都 支持 该 命令 。bash 使 用 echo-n 命 令 来 去 除 换行 符 ， 所 以 
如 果 确 信 自 己 的 脚本 程序 只 运行 在 bash 上 ， 你 就 可 以 使 用 如 下 的 


语法 : 


echo -n "Is it morning? Please answer yes or no: " 


请 注意 ， 你 需要 在 结束 引号 前 留 出 一 个 额外 的 空格 ， 这 使 得 在 
用 户 输入 响应 前 有 一 个 间隙， 从 而 看 起 来 更 加 整洁 。 


4. for 语 句 


我 们 可 以 用 for 结 构 来 循环 处 理 一 组 值 ， 这 组 值 可 以 是 任意 字符 串 的 
集合 。 它 们 可 以 在 程序 里 位 列 出 ， 更 师兄 的 做 法 古 使 用 shell 的 文件 名 扩 
展 结果 。 

它 的 语法 很 简单 : 

for variable in values 

do 

statements 
done 


实 验 使 用 固定 字符 串 的 for 循 环 
人 循环 值 通常 是 字符 串 ， 所 以 你 可 以 这 样 写 程序 : 


bin/sh 


该 程序 的 输出 结果 如 下 所 示 : 
bar 
fud 
43 


如 果 你 把 第 一 行 由 for foo in bar fud 43 修 改 为 for foo in “bar 
fud 43” 会 怎样 呢 ?” 别 忘 了 ， 加 上 引号 就 等 于 告诉 shell 把 引号 之 间 
的 一 切 东 西 都 看 作 是 一 个 字符 串 。 这 是 在 变量 里 保留 空格 的 一 种 
办 法 。 


实验 解析 

这 个 例子 创建 了 一 个 变量 foo， 然 后 在 for 循 环 里 每 次 给 它 赋 一 个 不 
同 的 值 。 因 为 shell 在 默认 情况 下 认为 所 有 变量 包含 的 都 是 字符 串 ， 所 以 
字符 串 43 在 使 用 中 与 字符 串 fud 是 一 样 合 法 有 效 的 。 


Se 验 使 用 通配符 扩展 的 for 人 循环 

正如 我 们 前 面 所 提 到 的 ，for 循 环 经 常 与 shell 的 文件 名 扩展 一 起 使 
用 。。 这 意味 着 在 字符 串 的 值 中 使 用 一 个 通配符 ， 并 由 shell 在 程序 执行 
时 填写 出 所 有 的 值 。 

你 已 经 在 最 早 的 first 例 子 中 见 过 这 种 做 法 了 。 该 脚本 程 厅 用 shell 扩 
展 把 * 扩 展 为 当前 目录 中 所 有 文件 的 名 字 ， 然 后 它们 依次 作为 for 循 环 中 
的 变量 $ile 使 用 。 

我 们 来 快速 地 看 看 另外 一 个 通配符 扩展 的 例子 。 假 设 你 想 打 印 当前 
目录 中 所 有 以 字母 { 开 头 的 脚本 文件 ， 并 且 你 知道 和 目 己 的 所 有 脚本 程序 
都 以 .sh 结尾 ， 你 就 可 以 这 样 做 : 


ipr file 


实验 解析 

这 个 例子 演示 了 $ (command) 语法 的 用 法 ， 我 们 将 在 后 面 的 内 容 
中 对 它 做 更 详细 地 介绍 (参见 2. 6. 6 节 ) 。 简 单 地 说 ，for 命 令 的 参数 表 
KAHES O 中 的 命令 的 输出 结果 。 

shell 扩 展 f*. sh 给 出 所 有 匹配 此 模式 的 文件 的 名 字 。 


请 记 住 ，shell 脚 本 程序 中 所 有 的 变量 扩展 都 是 在 脚本 程序 被 
执行 时 而 不 是 在 编号 它 时 完成 的 。 所 以 ， 变 量 声明 中 的 语法 错误 
只 有 在 执行 时 才 会 被 发 现 ， 就 像 前 面 我 们 给 空 变量 加 引号 的 例子 
中 看 到 的 那样 。 


5. whlie 语 句 


因为 在 默认 情况 下 ， 所 有 的 shell 变 量 值 都 被 认为 是 字符 串 ， 所 以 for 
人 循环 特别 适合 于 对 一 系列 字符 串 进行 循环 处 理 ， 但 如 末 你 事先 并 不 知道 
循环 要 执行 的 次 数 ， 那 么 它 就 显得 不 是 那么 有 用 了 。 

如 末 需 要 重复 执行 一 个 命令 序列 ， 但 事先 又 不 知道 这 个 命令 序列 应 
该 执行 的 次 数 ， 你 通常 会 使 用 一 个 while 循 环 ， 它 的 语法 如 下 所 示 : 


while condition do 
statements 
done 


请 看 下 面 的 例子 ， 这 是 一 个 非常 简陋 的 密码 检查 程序 : 


e | *Strythis* = * 


niie Stry - ecret” ] i 
echo "Sorry, try again’ 


这 个 脚本 程序 的 一 个 输出 示例 如 下 所 示 : 


Enter password 


password 
Sorry, try again 
secret 


È 


很 明显 ， 这 不 是 一 种 询问 密码 的 非常 安全 的 办 法 ， 但 它 确实 演示 了 
while 语 句 的 作用 。do 和 done 之 间 的 语句 将 反复 执行 ， 直 到 条 件 不 再 为 
真 。 在 这 个 例子 中 ， 你 检查 的 条 件 是 变量 trythis 的 值 是 否 等 于 secret。 循 
环 将 一 直 执 行 直 到 Strythis 等 于 secret。 随 后 你 将 继续 执行 脚本 程序 中 紧 
跟 在 done 后 面 的 语句 。 


6.，until 语 句 ] 


until 语 句 的 语法 如 下 所 示 : 
until condition 
do 
statements 
done 
它 与 while 循 环 很 相似 ， 只 是 把 条 件 测试 反 过 来 了 。 换 名 话说， 循 
环 将 反复 执行 直到 条 件 为 真 ， 而 不 是 在 条 件 为 真 时 反复 执行 。 


TIBOR DE, WAR tis BIA BD BUT IK, ABA NEH while (ffi 
SR; 如 宁可 能 根本 都 不 需要 执行 循环 ， 就 使 用 until 循 环 。 


下 面 是 一 个 until 循 环 的 例子 ， 你 设置 一 个 警报 ， 当 茶 个 特定 的 用 户 
， 该 警报 吏 会 月 动 ， 你 通过 命令 行将 用 户 名 传递 给 脚本 程序 。 如 
下 所 示 : 


如 果 用 户 已 经 登录 ， 那 么 循环 就 不 需要 执行 。 所 以 在 这 种 情况 下 ， 
使 用 until 语 句 比 使 用 while 语 句 更 自然 。 


7.case 语 名 


case 结 构 比 你 目前 为 止 见 过 的 其 他 结构 都 要 稍微 复 杂 一 些 。 它 的 语 
法 如 下 所 示 : 


case variable in 


~ torry f ~ 2 >Y ] crate O cee. 

pattern [ | pattern] ...) statements;; 

pattern [ | pattern] ...) statements;; 
esac 


这 看 上 去 有 些 令 人 生长 ， 但 case 结 构 允许 你 通过 一 种 比较 复杂 的 方 
式 将 变量 的 内 容 和 模式 进行 匹配 ， 然 后 再 根据 匹配 的 模式 去 执行 不 同 的 
Ne 。 这 要 比 使 用 多 条 让 、elif 和 else 语 句 来 执行 多 个 条 件 检查 要 简单 得 


请 注意 ， 每 个 模式 行 都 以 双 分 写 (;;〉 结尾 。 因 为 你 可 以 在 前 
后 模式 之 间 放 置 多 条 语句 ， 所 以 需要 使 用 一 个 双 分 写 来 标记 前 一 个 
语句 的 结束 和 后 一 个 模式 的 开始 。 


因为 case 结 构 具 备 匹 配 多 个 模式 然后 执行 多 条 相关 语句 的 能 力 ， 这 
使 得 它 非常 适合 于 处 理 用 户 的 输入 。 弄 明白 case 工 作 原 理 的 最 好 方法 就 
古 通 过 例子 来 进行 说 明 。 我 们 将 使 用 3 个 实验 例子 逐步 深入 地 对 它 进行 
介绍 ， 每 次 都 对 模式 匹配 进行 改进 。 


你 在 case 结 构 的 模式 中 使 用 如 * 这 样 的 通配符 时 要 小 心 。 因 为 
oo eee 即使 后 续 的 模式 有 更 加 精确 的 匹 
配 也 是 如 此 。 


实验 case 示 例 一 : 用 户 输入 
你 可 以 用 case 结 构 编 写 一 个 新 版 的 输入 测试 脚本 程序 ， 让 它 更 具 选 
择 性 并 且 对 非 预期 输入 也 更 宽容 : 


实验 解析 

当 case 语 句 被 执行 时 ， 它 会 把 变量 timeofday 的 内 容 与 各 字符 串 依 次 
进行 比较 。 一 旦 某 个 字符 串 与 输入 匹配 成 功 ，case 命 令 就 会 执行 紧 随 右 
括号 ) 后 面 的 代码 ， 然 后 就 结束 。 

case 命 令 会 对 用 来 做 比较 的 字符 串 进 行 正 常 的 通配符 扩展 ， 因 此 你 
可 以 指定 字符 串 的 一 部 分 并 在 其 后 加 上 一 个 * 通 配 符 。 只 使 用 一 个 单独 
的 * 表 示 逻 配 任 何 可 能 的 字符 串 ， 所 以 我 们 总 是 在 其 他 匹配 字符 串 之 后 
再 加 上 一 个 * 以 确保 如 果 没 有 字符 串 得 到 匹配 ，case 语 句 也 会 执行 某 个 
默认 动作 。 之 所 以 能 够 这 样 做 是 因为 case 语 句 是 按 顺 序 比 较 每 一 个 字符 
串 ， 它 不 会 去 得 找 最 佳 匹 配 ， 而 仅仅 是 查找 第 一 个 匹配 。 因 为 默认 条 件 
eee 所 以 使 用 * 对 脚本 程序 的 调试 很 有 
KAY 


ses case 示 例 二 : 合并 匹配 模式 
上 面 例子 中 的 case 结 构 明 显 比 多 个 if 语 句 的 版 本 更 精致 ， 但 通过 合 
并 匹配 模式 ， 你 可 以 编写 一 个 更 加 清晰 的 版 本 。 如 下 所 示 : 


实验 解析 

这 个 脚本 程序 在 每 个 case 条 目 中 都 使 用 了 多 个 字符 串 ，case 将 对 每 
个 条 目 中 的 多 个 不 同 的 字符 串 进 行 测试 ， 以 决定 是 否 需 要 执行 相应 的 语 
句 。 这 使 得 脚本 程序 不 仅 长 度 变 短 ， 而 且 实 际 上 也 更 容易 阅读 。 这 个 脚 
本 程序 同时 还 显示 了 *# 通 配 符 的 用 法 ， 虽 然 这 样 做 有 可 能 匹配 意料 之 外 
的 模式 。 例 如 ， 如 果 用 户 输入 never， 它 就 会 匹配 n* 并 显示 出 Good 


Afternoon， 而 这 并 不 是 我 们 和 希望 的 行为 。 另 外 需要 注意 的 是 * 通 配 符 打 - 
展 在 引号 中 不 起 作用 。 


实验 case 示 例 三 : 执行 多 条 语句 
最 后 ， 为 了 让 这 个 脚本 程序 具备 可 重用 性 ， 你 需要 在 使 用 默认 模式 
时 给 出 另外 一 个 退出 码 。 如 下 所 示 : 


实验 解析 

为 了 演示 模式 匹配 的 不 同 用 法 ， 这 个 代码 改 变 了 no 情况 下 的 匹配 方 
法 。 你 还 看 到 了 如 何在 case 语 句 中 为 每 个 模式 执行 多 条 语句 。 注 意 ， 你 
必须 很 小 心地 把 最 精确 的 匹配 放 在 最 开始 ， 而 把 最 一 般 化 的 匹配 放 在 最 
后 。 这 样 做 很 重要 ， 因 为 case 将 执行 它 找到 的 第 一 个 匹配 而 不 是 最 佳 匹 
E E A E 
RIL o 


请 注意 ，esac 前 面 的 双 分 号 G) 是 可 选 的 。 在 C 语 言 程 序 设计 
中 ， 即 使 少 一 个 break 语 句 都 算是 不 好 的 程序 设计 做 法 ， 但 在 shell 程 
序 设 计 中 ， 如 果 最 后 一 个 case 模 式 是 默认 模式 ， 那 么 省 略 最 后 一 个 
人 
Efo 
为 了 让 case 的 匹配 功能 更 强大 ， 你 可 以 使 用 如 下 的 模式 : 
[yY] | [Yy] [Ee] [Ss] ) 


这 限制 了 允许 出 现 的 字母 ， 但 它 同 时 也 允许 多 种 多 样 的 答案 并 且 提 
供 了 比 * 通 配 符 更 多 的 控制 。 


8. 命令 列表 


有 时 ， 你 想 要 将 几 条 命令 连接 成 一 个 序列 。 例 如 ， 你 可 能 想 在 执行 
某 个 语句 之 前 同时 满足 好 几 个 不 同 的 条 件 ， 如 下 所 示 : 
if [ -£ this_file }]; then 


fi 


或 者 你 可 能 希望 至 少 在 这 一 系列 条 件 中 有 一 个 为 真 ， 像 下 面 这 样 : 


er file ]; then 


虽然 这 可 以 通过 使 用 多 个 站 语句 来 实现 ， 但 如 你 所 见 ， 写 出 来 的 程 
序 非常 茶 拙 .shell 提 供 了 一 对 特殊 的 结构 ， 专 门 用 于 处 理 命令 列表 ， 它 们 
是 AND 列 表 和 OR 列表 。 虽 然 它 们 通常 在 一 起 使 用 ， 但 我 们 将 分 别 介 绍 
它们 的 语法 。 

。AND 列 表 

AND 列 表 结 构 允 许 你 按照 这 样 的 方式 执行 一 系列 命令 ; 只 有 在 前 面 
所 有 的 命令 都 执行 成 功 的 情况 下 才 执 行 后 一 条 命令 。 它 的 语法 是 : 
statementl && statement2 && statement3 && ... 


从 左 开始 顺序 执行 每 条 命令 ， 如 末 一 条 命令 返回 的 是 true， 它 右边 
的 下 一 条 命令 才能 够 执行 。 如 此 持续 直到 有 一 条 命令 返回 false， 或 者 列 
表 中 的 所 有 命令 都 执行 完毕 。&& 的 作用 是 检查 前 一 条 命令 的 返回 值 。 

每 条 语句 都 是 独立 执行 ， 这 就 允许 你 把 许多 不 同 的 命令 混合 在 一 个 
单独 的 命令 列表 中 ， 就 像 下 面 的 脚本 程序 显示 的 那样 。AND 列 表 作 为 一 
个 整体 ， 只 有 在 列表 中 的 所 有 命令 都 执行 成 功 时 ， 才 算 它 执行 成 功 ， 人 否 
则 就 算 它 失 败 。 


sx 验 AND 列 表 

在 下 面 的 脚本 程序 中 ， 你 执行 touch file one 命令“〈 检 查 文件 是 否 存 
在 ， 如 果 不 存 在 就 创建 并 删除 包 e_two 文 件 。 然 后 用 AND 列 表 检 查 每 个 
文件 是 否 存在 并 通过 echo 命 令 给 出 相应 的 指示 。 


fi 


执行 这 个 脚本 程序 ， 你 将 看 到 如 下 所 示 的 结果 : 


实验 解析 

touch 和 rm 命令 确保 当前 目录 中 的 有 关 文 件 处 于 已 知 状态 。 然 后 && 
列表 执行 [-f 他 e_one] 语 句 ， 这 条 语句 肯定 会 执行 成 功 ， 因 为 你 已 经 确保 
该 文件 是 存在 的 了 。 因 为 前 一 条 命令 执行 成 功 ， 所 以 echo 命 令 得 以 执 
行 ， 它 也 执行 成 功 〈echo 命 令 总 是 返回 true) 。 当 执行 第 三 个 测试 [-{ 
file_two] 时 ， 因 为 该 文件 并 不 存在 ， 所 以 它 执行 失败 了 。 这 条 命令 的 失 
败 导致 最 后 一 条 echo 语 句 未 被 执行 。 而 因为 该 命令 列表 中 的 一 条 命令 失 
败 了 ， 所 以 && 列 表 的 总 的 执行 结果 是 false, 让 语句 将 执行 它 的 else 部 分 。 


。OR 列 表 
OR 列表 结构 允许 我 们 持续 执行 一 系列 命令 直到 有 一 条 命令 成 功 为 
止 ， 其 后 的 命令 将 不 再 被 执行 。 它 的 语法 是 : 


ora = q ae = A mm sm 和 *) = a AMAT 2 
statementi | | statemente | | statement; | | s ace 


从 左 开始 顺序 执行 每 条 命令 。 如 末 一 条 命令 返回 的 是 false， 它 右边 
的 下 一 条 命令 才能 够 被 执行 。 如 此 持续 下 到 有 一 条 命令 返回 true， 或 者 
列表 中 的 所 有 命令 都 执行 完毕 。 

| 列表 和 && 列 表 很 相似 ， 只 是 继续 执行 下 一 条 语句 的 条 件 现在 变 为 
其 前 一 条 语句 必须 执行 失败 。 


X 验 OR 列表 
沿用 上 一 个 例子 ， 但 要 修改 下 面 程序 清单 里 阴影 部 分 的 语句 : 


这 个 脚本 程序 的 输出 是 : 


实验 解析 
头 两 行 代码 简单 的 为 脚本 程序 的 剩余 部 分 设置 好 相应 的 文件 。 第 一 
条 命令 [-f fie_one] 失 败 了 ， 因 为 这 个 文件 不 存在 。 接 下 来 执行 echo 语 


这 两 种 结构 的 返回 结果 都 等 于 最 后 一 条 执行 语句 的 返回 结果 。 

这 些 列 表 类 型 结构 的 执行 方式 与 C 语 言 中 对 多 个 条 件 进行 测试 的 执 
行 方式 很 相似 。 只 需 执行 最 少 的 语句 就 可 以 确定 其 返回 结果 。 不 影 啊 返 
回 结 果 的 语句 不 会 被 执行 。 这 通常 被 称 为 短路 径 求 值 Cshortcircuit 
evaluation ) 。 


将 这 两 种 结构 结合 在 一 起 将 更 能 体现 逻辑 的 魅力 。 请 看 : 


f file one ] && command for true || command for false 

在 上 面 的 语句 中 ， 如 果 测 试 成 功 就 会 执行 第 一 条 命令 ， 否 则 执行 第 
二 条 命令 。 你 最 好 用 这 些 不 寻常 的 命令 列表 来 进行 实验 ， 但 在 通常 情况 
下 ， 你 应 该 用 括号 来 强制 求 值 的 顺序 。 


9. 语句 块 


如 果 你 想 在 某 些 只 允许 使 用 单个 语句 的 地 方 “比如 在 AND 或 OR 列 
表 中 ) 使 用 多 条 语句 ， 你 可 以 把 它们 括 在 花 括号 们 中 来 构造 一 个 语句 
块 。 例 如 ， 在 本 章 后 面 给 出 的 应 用 程序 中 ， 你 将 看 到 如 下 所 示 的 代码 : 


2.6.4 ”函数 


你 可 以 在 shell 中 定义 函数 。 如 果 你 想 编写 大 型 的 shell 脚 本 程序 ， 你 
会 想到 用 它们 来 构造 自己 的 代码 。 


作为 为 一 种 选择 ， 你 可 以 把 一 个 大 型 的 脚本 程序 分 成 许多 小 一 
扩 的 脚本 程序 ， 让 每 个 脚本 完成 一 个 小 任务 。 但 这 种 做 法 有 几 个 缺 
Fas 在 一 个 脚本 程序 中 执行 为 外 一 个 脚本 程序 要 比 执行 一 个 函数 慢 
得 多 ; 返回 执行 结果 变 得 更 加 困难 ， 而 且 可 能 存在 非常 多 的 小 脚 
本 。 你 应 该 考虑 目 己 的 脚本 程序 中 是 否 有 可 以 明显 的 单独 存在 的 最 
MR ee ee 
I 衡量 尺度 。 


要 定义 一 个 shell 函 数 ， 你 只 需 写 出 它 的 名 字 ， 然 后 是 一 对 空 括号 ， 
再 把 函数 中 的 语句 放 在 一 对 花 括 号 中 ， 如 下 所 示 : 


) 


实 验 一 个 简单 的 函数 
我 们 从 一 个 非常 简单 的 函数 开始 : 


运行 这 个 胜 本 程序 会 显示 如 下 的 输出 信息 ; 


“运行 这 个 脚本 程序 会 显示 如 下 的 输出 信息 ; 


实验 解析 

这 个 脚本 程序 还 是 从 自己 的 顶部 开始 执行 ， 这 一 点 与 其 他 脚本 程序 
没什么 分 别 。 但 当 它 遇见 foo〈) {结构 时 ， 它 知道 脚本 正在 定义 一 个 名 
为 foo 的 冰 数 。 它 会 记 住 foo 代 表 着 一 个 函数 并 从 } 字 符 之 后 的 位 置 继续 执 
行 。 当 执行 到 单独 的 行 foo 时 ，shell 就 知道 应 该 去 执行 刚才 定义 的 函数 


了 。 当 这 个 函数 执行 完毕 以 后 ， 执 行 过 程 会 返回 到 调用 foo 函 数 的 那 条 
语句 的 后 面 继续 执 行 。 

你 必须 在 调用 一 个 函数 之 前 先 对 它 进行 定义 ， 这 有 反 像 Pascal 语 言 
里 函数 必须 先 于 调用 而 被 定义 的 概念 ， 只 是 在 shell 中 不 存在 前 问 声 明 。 
但 这 并 不 会 成 为 什么 问题 ， 因 为 所 有 脚本 程序 都 是 从 顶部 开始 执行 ， 所 
以 只 要 把 所 有 函数 定义 都 妈 罗 放 在 任何 一 个 函数 调用 之 前 ， 就 可 以 保证 
所 有 的 函数 在 和 被 调 用 之 前 就 被 定义 了 。 

当 一 个 函数 被 调用 时 ， 脚 本 程序 的 位 置 参数 ($*. $@. SH. 
$1、$2 等 ) 会 被 替换 为 函数 的 参数 。 这 也 是 你 读 取 传 递 给 函数 的 参数 的 
办 法 。 当 函数 执行 完毕 后 ， 这 些 参 数 会 恢复 为 它们 先前 的 值 。 


一 些 老 版 本 的 shell 在 函数 执行 之 后 可 能 不 会 恢复 位 置 参 数 的 
值 。 所 以 如 果 你 想 让 自己 的 脚本 程序 具备 可 移植 性 ， 束 最 好 不 要 
依赖 这 一 行为 。 


你 可 以 通过 returm 命 令 让 函数 返回 数字 值 。 让 函数 返回 字符 串 值 的 
常用 方法 是 让 函数 将 字符 串 保 存在 一 个 变量 中 ， 该 变量 然后 可 以 在 函数 
结束 之 后 被 使 用 。 此 外 ， 你 还 可 以 echo 一 个 字符 串 并 捕获 其 结果 ， 如 下 
所 示 : 


{ echo JAY;) 


请 注意 ， 你 可 以 使 用 local 关 键 字 在 shell 函 数 中 声明 局 部 变量 ， 局 部 
变量 将 仅 在 函数 的 作用 范围 内 有 效 。 此 外 ， 函 数 可 以 访问 全 局 作用 范围 
内 的 其 他 shell 变 量 。 如 有 果 一 个 局 部 变量 和 一 个 全 局 变量 的 名 字 相 同 ， 前 
Smee, (AMIR RECA. Blan, May Ax ET 
的 脚本 程序 进行 如 下 的 修改 来 查看 执行 结 


sample text="global variable’ 


echo Ssample_text 


如 果 在 函数 里 没有 使 用 retum 命 令 指 定 一 个 返回 值 ， 函 数 返回 的 就 
是 执行 的 最 后 一 条 命令 的 退出 码 。 


实 验 从 函数 中 返回 一 个 值 
下 一 个 脚本 程序 my_name 演 示 了 函数 的 参数 是 如 何 传 递 的 ， 以 及 函 
数 如 何 返 回 一 个 true 或 false 值 。 你 使 用 一 个 参数 来 调用 该 脚本 程序 ， 该 


参数 是 你 想 要 在 问题 中 使 用 的 名 字 。 
ace. fEshellSkZ Ja, FRAME X T ek BWyes_or_no: 


o 


gin 


exit 0 


这 个 脚本 程序 的 典型 输出 如 下 所 示 : 


$ ./my_name Rick Neil 

Original parameters are Rick Neil 
Is your name Rick ? 

Enter yes or no: yes 

Hi Rick, nice name 


(~ 
Y 


实验 解析 

脚本 程序 开始 执行 时 ， 函 数 yes_or_no 被 定义 ， 但 先 不 会 执行 。 在 让 
语句 中 ， 脚 本 程序 执行 到 函数 yes_or_no 时 ， 先 把 $1 替换 为 脚本 程序 的 第 
一 个 参数 Rick， 再 把 它 作 为 参数 传递 给 这 个 函数 。 函 数 将 使 用 这 些 参数 
(它们 现在 被 保存 在 $1、$2 等 位 置 参 数 中 ) 并 回调 用 者 返回 一 个 值 。if 
结构 再 根据 这 个 返回 值 去 执行 相应 的 语句 。 

如 你 所 匈 ，shell 有 着 直 富 的 控制 结构 和 条 件 语句 。 接 下 来 ， 你 需要 
学 习 一 些 shell 的 内 置 命令 ， 然 后 你 就 要 在 不 使 用 编译 露 的 情况 下 解决 一 
个 实际 的 程序 设计 问题 了 ! 


2.6.5 命令 
你 可 以 在 shell 脚 本 程序 内 部 执行 两 类 命令 。 一 类 是 可 以 在 命令 提示 
符 中 执行 的 普通” 命令， 也 称 为 外 部 命令 Cexternal command) ,一 类 


是 我 们 前 面 提 到 的 内置” 命令， 也 称 为 内 部 命令 Cinternal command) 。 
内 置 命令 是 在 shell 内 部 实现 的 ， 它 们 不 能 作为 外 部 程序 被 调用 。 然 而 ， 
大 多 数 的 内 部 命令 同时 也 提供 了 独立 运行 的 程序 版 本 一 一 这 一 需求 是 
POSIX 规 范 的 一 部 分 。 通 常情 况 下 ,命令 是 内 部 的 还 是 外 部 的 并 不 重 
要 ， 只 是 内 部 命令 的 执行 效率 更 高 。 

我 们 在 这 里 将 只 介绍 那些 在 编写 脚本 程序 时 会 用 到 的 主要 命令 ， 不 
分 内 部 还 是 外 部 。 作 为 一 个 Linux 用 户 ， 你 可 能 还 知道 许多 其 他 可 以 在 
命令 提示 符 下 执行 的 合法 命令 。 请 记 住 ， 除 了 我 们 在 这 里 介绍 的 内 置 命 
令 外 ， 它 们 同样 也 可 以 在 脚本 程序 中 使 用 。 

1. break 命 令 

你 可 以 用 这 个 命令 在 控制 条 件 未 满足 之 前 ， 跳 出 for、while 或 until 
循环 。 你 可 以 为 break 命 令 提 供 一 个 额外 的 数值 参数 来 表明 需要 跳出 的 
循环 层 数 ， 但 我 们 并 不 建议 读者 这 么 做 ， 因 为 它 将 大 大 降低 程序 的 可 读 
性 。 在 默认 情况 下 ，break 只 跳出 一 层 循环 。 


2.: 命令 
BS CG ) 命令 是 一 个 空 命令 。 它 偶尔 会 被 用 于 简化 条 件 逻 辑 ， 相 
当 于 true 的 一 个 别名 。 由 于 它 是 内 置 命令 ， 所 以 它 运 行 的 比 true 快 ， 但 它 
的 输出 可 读 性 较 闫 。 

你 可 能 会 看 到 将 它 用 作 while 循 环 的 条 件 ，while: 实现 了 一 个 无 限 
循环 ， 代 蔡 了 更 第 见 的 whiletrue. 

: 结构 也 会 被 用 在 变量 的 条 件 设置 中 ， 例 如 ; 


S{var:=value} 
如 果 没 有 : ,shell 将 试图 把 竺 var 当 作 一 条 命令 来 处 理 。 


在 一 些 shell 肢 本， 主要 是 一 些 旧 的 shell 脚 本 中 ， 你 可 能 会 看 
到 冒 邱 被 用 在 一 行 的 开头 来 表示 一 个 注释 。 但 现代 的 脚本 总 是 用 # 
来 开始 一 个 注释 行 ， 因 为 这 样 做 执行 效率 更 高 。 


3. continue 命 令 
韭 常 类 似 C 语 言 中 的 同名 语句 ， 这 个 命令 使 for、while 或 until 循 环 跳 
到 下 一 次 循环 继续 执行 ， 循 环 变量 取 循 环 列表 中 的 下 一 个 值 。 


continue HJ VA iy — 7S HY EASRA ZEN a ES RAAT A A REE 
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会 导致 脚本 程序 极 难 理解 。 例 如 : 


它 的 输出 是 : 
before 1 
before 


before 
4 命令 


点 (.) 命令 用 于 在 当前 shell 中 执行 命令 ; 
./shell script 


通常 ， 当 一 个 脚本 执行 一 条 外 部 命令 或 脚本 程序 时 ， 它 会 创建 一 个 
新 的 环境 《〈 一 个 子 shell) ， 命 令 将 在 这 个 新 环境 中 执行 ， 在 命令 执行 完 
毕 后 ， 这 个 环境 被 丢弃 ， 留 下 退出 码 返 回 给 父 shell。 但 外 部 的 source 命 
令 和 点 命令 〈 这 两 个 命令 差不多 是 同义词 ) 在 执行 脚本 程序 中 列 出 的 命 
令 时 ， 使 用 的 是 调用 该 脚本 程序 的 同一 个 shell. 

因为 在 默认 情况 下 ，shell 脚 本 程序 会 在 一 个 新 创建 的 环境 中 执行 ， 
所 以 脚本 程序 对 环境 变量 所 作 的 任何 修改 都 会 丢失 。 而 点 命令 允许 执行 
的 脚本 程序 改变 当前 环境 。 当 你 要 把 一 个 脚本 当 作 “ 包 囊 器 ”来 为 后 续 执 
行 的 一 些 其 他 命令 设置 环境 时 ， 这 个 命令 通常 束 很 有 用 。 例 如 ， 如 果 你 
正 同 时 参与 几 个 不 同 的 项 目 ， 你 就 可 能 会 遇 到 需要 使 用 不 同 的 参数 来 调 


GW) DN - 


用 命令 的 情况 ， 比 如 说 调用 一 个 老 版 本 的 编译 器 来 维护 个 旧 程 序 。 

在 shell 脚 本 程序 中 ， 点 命令 的 作用 有 点 类 似 于 C 或 C++ 语言 里 的 
#include 指 令 。 尽 管 它 并 没有 从 字面 意义 上 包含 脚本 ， 但 它 的 确 是 在 当 
II 所 以 你 可 以 使 用 它 将 变量 和 函数 定义 结合 进 脚本 
Eye 


实 验 点 (.) 命 

信行 中 使 用 点 命令 ， 但 你 完全 可 以 把 它 用 在 一 个 脚 
本 程序 中 。 

(1) 假设 你 有 两 个 包含 环境 设置 的 文件 ， 它 们 分 别针 对 两 个 不 同 
的 开发 环境 。 为 了 设置 老 的 、 经 典 命令 的 环境 ， 你 可 以 使 用 文件 
classic_set， 它 的 内 容 如 下 所 示 : 


| D ) 对 于 新 命令 使 用 文件 latest_set 


你 可 以 通过 将 这 些 脚本 程序 和 点 命令 结合 来 设置 环境 ， 就 像 下 面 的 
不 例 那 样 ; 


. /classic set 
`> echo $ver 


sic> . /latest_set 
re n> echo $version 


实验 解析 

这 个 脚本 程序 使 用 点 命令 执行 ， 所 以 每 个 脚本 程序 都 是 在 当前 shell 
中 执行 。 这 使 得 脚本 程序 可 以 改变 当前 shell 中 的 环境 设置 ， 即 使 脚本 程 
序 执行 结束 后 ， 这 些 改变 仍然 有 效 。 


5. echo 命 令 

HAA, X/Open 建议 在 现代 shel 冲 使 用 printf 命 令 ， 但 我 们 还 是 依照 常 
规 使 用 echo 命 令 来 输出 结尾 带 有 换行 符 的 字符 串 。 

一 个 常见 的 问题 是 如 何 去 掉 换行 符 。 遗憾 的 是 ， 不 同 版 本 的 UNIX 
对 这 个 问题 有 着 不 同 的 解决 方法 。Linux 津 用 的 解决 方法 如 下 所 示 : 


echo -n "string to output" 
但 你 也 经 常会 遇 到 ; 
echo -e “string to output\c" 

MTT echo- Ra H T BREE AE ORRE MIT 
符 ，X 代 表 制 表 符 ， 代 表 回 车 ) 的 解释 。 在 老 版 本 的 bash 中 ， 对 反 斜 线 
转 义 字符 的 解释 通常 都 是 默认 启用 的 ， 但 最 新 版 本 的 bash 通 常 在 默认 情 
况 下 都 不 对 反 斜 线 转 义 字 符 进 行 解释 。 你 所 使 用 的 Linux 发 行 版 的 详细 
行为 请 查看 相关 手册 。 


如 果 你 需要 一 种 删除 结尾 换行 符 的 可 移植 方法 ， 则 可 以 使 用 
外 部 命令 tr 来 删除 它 ， 但 它 执 行 的 速度 比较 慢 。 如 果 你 需要 自己 
的 脚本 兼容 UNIX 系 统 并 且 需 要 删除 换行 符 ， 最 好 坚持 使 用 printf 
命令 。 如 果 你 的 脚本 只 需要 运行 在 Linux 和 bash 上， 那么 echo-n 是 
不 错 的 选择 ， 虽 然 你 可 能 需要 在 脚本 的 开头 加 上 #1bin/bash， 以 
明确 表示 你 需要 bash 格 的 行为 。 


6. eval 命 令 

eval 命 令 允 许 你 对 参数 进行 求 值 。 它 是 shell 的 内 置 命 令 ， 通 党 不 会 
以 单独 命令 的 形式 存在 。 我 们 借用 X/Open 规范 中 的 一 个 小 例子 来 演示 它 
的 用 法 : 


Emh Y foo, m 


输出 10。 因 此 ，eval 命 令 有 点 像 一 个 额外 的 六， 它 给 出 一 个 变量 的 
的 值 


eval 命 令 十 分 有 用 ， 它 允许 代码 被 随时 生成 和 运行 。 虽 然 它 的 确 增 
加 了 脚本 调试 的 复杂 度 ， 但 它 可 以 让 你 完成 使 用 其 他 方法 难以 或 者 根本 
无 法 完成 的 事情 。 

7. exec 命 令 

exec 命 令 有 两 种 不 同 的 用 法 。 它 的 典型 用 法 是 将 当前 shell 蔡 换 为 一 
个 不 同 的 程序 。 例 如 : 


exec wall "Thanks for all the fish" 


脚本 中 的 这 个 命令 会 用 wall 命 令 蔡 换 当 前 的 shell。 脚 本 程序 中 exec 命 令 
后 面 的 代码 都 不 会 执行 ， 因 为 执行 这 个 脚本 的 shell 已 经 不 存在 了 。 
exec 的 第 二 种 用 法 是 修改 当前 文件 描述 符 : 


exec 3< afile 


这 使 得 文件 描述 符 3 被 打开 以 便 从 文件 afile 中 读 取 数据 。 这 种 用 法 
非常 少见 。 

8. exit nf 

exit 命 令 使 脚本 程序 以 退出 码 n 结 束 运 行 。 如 果 你 在 任何 一 个 交互 式 
shell 的 命令 提示 符 中 使 用 这 个 命令 ， 它 会 使 你 退出 系统 。 如 果 你 允许 目 
己 的 脚本 程序 在 退出 时 不 指定 一 个 退出 状态 ， 那 么 该 脚本 中 最 后 一 条 被 
执行 命令 的 状态 将 被 用 作为 返回 值 。 在 脚本 程序 中 提供 一 个 退出 码 总 是 
一 个 良好 的 习惯 。 

在 shell 脚 本 编程 中 ， 退 出 码 0 表示 成 功 ， 退 出 码 1~~125 是 脚本 程序 
可 以 使 用 的 错误 代码 。 其 余数 字 具 有 保留 含义 ， 如 表 2-7 所 示 。 


表 2-7 


Bt & 说 BH 


用 0 表示 成 功 对 于 许多 C/C++ 程 序 员 来 说 可 能 有 些 不 寻常 。 在 脚本 
程序 中 ， 这 种 做 法 的 一 大 优点 是 ， 它 使 得 你 可 以 使 用 多 达 125 个 用 户 自 
定义 的 错误 代码 ， 而 不 需要 使 用 一 个 全 局 的 错误 代码 变量 。 

下 面 是 一 个 简单 的 例子 ， 如 果 当前 目录 下 存在 一 个 名 为 .profile 的 文 
件 ， 它 就 返回 0 表示 成 功 : 


如 果 你 是 个 精 苑 求 精 的 人 ， 或 至 少 追 求 更 简洁 的 脚本 ， 那 么 你 可 以 
ae 前 面 介绍 过 的 AND 和 OR 列表 来 重 写 这 个 脚本 程序 ， 只 需要 一 
行 代码 : 


[ -f .profile ] && exit 0 || exit 1 


9.export 命 令 

export 命 令 将 作为 它 参 数 的 变量 导出 到 子 shell 中 ， 并 使 之 在 子 shell 
中 有 效 。 在 默认 情况 下 ， 在 一 个 shell 中 被 创建 的 变量 在 这 个 shell 调 用 的 
下 级 〈 子 )shell 中 是 不 可 用 的 。export 命 令 把 自己 的 参数 创建 为 一 个 环 
境 变 量 ， 而 这 个 环境 变量 可 以 被 当前 程序 调用 的 其 他 脚本 和 程序 看 见 。 
从 更 技术 的 角度 来 说 ， 被 导出 的 变量 构成 从 该 shell 衍 生 的 任何 子 进程 的 
环境 变量 。 我 们 用 下 面 两 个 脚本 程序 exgportL1 和 export2 来 说 明 它 的 用 法 。 


C1) 我 们 先 列 出 脚本 程序 export2: 


"Shbar” 


(2) 然后 是 脚本 程序 export1。 在 这 个 脚本 的 结尾 ， 我 们 调用 了 


export2: 


如 末 你 运行 这 个 脚本 程序 ， 你 将 得 到 如 下 的 输出 : 


exportl 


实验 解析 

export2 脚 本 只 是 回 显 两 个 变量 的 值 。export1 脚 本 同时 设置 两 个 变 
， 但 只 导出 变量 bar， 所 以 当 它 其 后 调用 export2 时 ， 变 量 foo 的 值 已 丢 
， 但 变量 bar 的 值 已 被 导出 到 第 二 个 脚本 中 。 脚 本 输出 中 第 一 个 空 行 
出 现 是 因为 $foo 在 export2 中 没有 定义 ， 回 显 一 个 null 变 量 将 输出 一 个 


一 旦 一 个 变量 被 shell 导 出 ， 它 就 可 以 被 该 shell 调 用 的 任何 脚本 使 
用 ， 也 可 以 被 后 续 依 次 调用 的 任何 Shell 使 用 。 如 果 脚 本 export2 调 用 了 另 
一 个 脚本 ，bar 的 值 对 新 脚本 来 说 仍然 有 效 。 


SN 
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set -a 或 set -allexport 命 令 将 导出 它 之 后 声明 的 所 有 变量 。 


10. expr 命 令 


expr 命 令 将 它 的 参数 当 作 一 个 表达 式 来 求 值 。 它 的 最 常见 用 法 就 是 


进行 如 下 形式 的 简单 数学 运算 : 


x= expr $x +t 1 
RIS CO 字符 使 x 取 值 为 命令 expr $x + 1 的 执行 结果 。 你 也 可 以 
EY O 蔡 换 反 引 号 、， 如 下 所 示 : 


x=$ (expr $x + 1) 
expr 命 令 的 功能 十 分 强大 ， 它 可 以 完成 许多 表达 式 求 值 计算 。 表 2-8 
列 出 了 主要 的 一 些 求 值 计算 。 
2-8 
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CERI exp 2a A A ROUSE ED ¥ 
CCOO 语法， 这 个 我 们 会 在 本 章 后 面 的 内 容 中 介 
11. printf 
只 有 最 新 版 本 的 shell 才 提供 printft 命 令 。X/Open 规 范 建议 我 们 应 该 
用 它 来 代 蔡 echo 命 令 ， 以 产生 格式 化 的 输出 ， 但 看 来 几乎 没什么 人 接受 
这 一 建议 。 
它 的 ales 


printf ormat string" parameterl parameter 


格式 字符 串 与 C/C++ 中 使 用 的 非 第 相似 ， 但 有 一 些 自己 的 限制 。 
要 是 不 文 持 浮 点 数 ， 因为 sheli 中 所 有 的 算术 运算 都 是 按照 对 数 来 进行 计 
算 的 。 格 式 字符 串 由 各 种 可 打印 字符 、 转 义 序列 和 字符 转换 限定 符 组 
成 。 格 式 字符 串 中 除了 % 和 \ 之 外 的 所 有 字符 都 将 按 原样 输出 。 


” 表 2-9 列 出 了 它 支持 的 转 义 序列 。 
表 2-9 
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转 义 序列 说 a 


字符 转换 限定 符 相 当 复 杂 ， 所 以 我 们 在 这 里 只 列 出 最 常见 的 用 法 。 
更 详细 的 介绍 可 以 参考 bash 的 在 线 手册 或 printf 在 线 手册 的 第 一 部 分 
(man 1 printf) 。 如 果 在 手册 的 第 一 部 分 找 不 到 ， 你 可 以 尝试 查找 手册 
的 第 三 部 分 。 字 符 转 换 限定 符 由 一 个 % 和 跟 在 后 面 的 一 个 转换 字符 组 
成 。 主 要 的 转换 字符 如 表 2-10 所 示 。 


表 2-10 


字符 转换 限定 符 mm 


* 8 # & 
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格式 字符 串 然后 被 用 来 解释 printf 后 续 参 数 的 含义 并 输出 结果 。 例 
如 : 
$ printf "%s\n" hello 


hello 
$ printf "%s %d\t%s" "Hi There" 15 people 
Hi There 15 people 


ee ee en te emer ieee 

12. return 命 令 

return 命 令 的 作用 是 使 函数 返回 。 我 们 在 前 面 介 绍 函 数 时 已 提 到 过 
它 。return 命 令 有 一 个 数值 参数 ， 这 个 参数 在 调用 该 函数 的 脚本 程序 里 
被 看 做 是 该 函数 的 返回 值 。 如 果 没 有 指定 参数 ，return 命 令 默 认 返 回 最 
后 一 条 命令 的 退出 码 。 

13. set 命 令 

set 命 令 的 作用 是 为 shell 设 置 参数 变量 。 许 多 命令 的 输出 结果 是 以 空 
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假设 你 想 在 一 个 shell 脚 本 中 使 用 当前 月 份 的 名 字 。 系 统 本 身 提 供 了 
一 个 date 命 令 ， 它 的 输出 结果 中 包含 了 字符 串 形式 的 月 份 名 称 ， 但 是 你 
需要 把 它 与 其 他 区 域 分 隔 开 。 你 可 以 将 set 命 令 和 壮 。 〈,….) 结构 相 结合 
来 执行 date 命 令 ， 并 且 返 回想 要 的 结果 。date 命 令 的 输出 把 月 份 字符 串 
作为 它 的 第 二 个 参数 ， 


这 个 程序 把 date 命 令 的 输出 设置 为 参数 列表 ， 然 后 通过 位 置 参数 2 
获得 月 份 。 

注意 ， 我 们 以 date 命 令 作为 一 个 简单 的 例子 来 说 明 怎 么 提取 位 置 参 
数 。 由 于 date 命 令 的 输出 受 本 地 语言 的 影响 较 大 ， 所 以 在 实际 工作 中 ， 
你 应 该 使 用 date +9%B 命 令 来 提取 月 份 名 字 。date 命 令 还 有 许多 其 他 格式 
选项 ， 详 细 资 料 请 参考 它 的 手册 页 。 

你 还 可 以 通过 set 命 令 和 它 的 参数 来 控制 shell 的 执行 方式 。 其 中 最 常 
用 的 命令 格式 是 set-x， 它 让 一 个 脚本 程序 跟踪 显示 它 当 前 执行 的 命令 。 
我 们 将 在 本 章 后 面 介绍 程序 调试 时 讨论 set 命 令 和 它 更 多 的 选项 。 

14. shift 命 令 

shift 命 令 把 所 有 参数 变量 左 移 一 个 位 置 ， 使 六 2 变 成 站 1， $ 3 变 成 
对 2， 以 此 类 推 。 原 来 兰 1 的 值 将 被 丢弃 ， 而 $0 仍 将 保持 不 变 。 如 果 调 用 
shift 命 令 时 指定 了 一 个 数值 参数 ， 则 表示 所 有 的 参数 将 左 移 指定 的 次 
Seat eaters a ed es eel na 
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在 扫描 处 理 脚本 程序 的 参数 时 ， 经 常 要 用 到 shift 命 令 。 如 果 你 的 脚 
本 程序 需要 10 个 或 10 个 以 上 的 参数 ， 你 就 需要 用 shift 命 令 来 访问 第 十 个 
及 其 后 面 的 参数 。 

例如 ， 你 可 以 像 下 面 这 样 依次 扫描 所 有 的 位 置 参数 : 


15. trap 

trap 命 令 用 于 指定 在 接收 到 信和 号 后 将 要 采取 的 行动 ， 我 们 将 在 本 书 
后 面 的 内 容 中 详细 介绍 信号 。trap 命 令 的 一 种 第 见 用 途 是 在 脚本 程序 被 
中 断 时 完成 清理 工作 。 历 史上 ，shell 总 是 用 数字 来 代表 信号 ， 但 新 的 脚 


本 程序 应 该 使 用 信和 号 的 名 字 ， 和 它们 定义 在 头 文件 signal， ht, ERHI 
写 名 时 需要 省 略 SIG 前 级 。 你 可 以 在 命令 提示 和 从 下 输入 命令 trap -IKA 
看 信号 编号 及 其 关联 的 名 称 。 


对 于 那些 不 熟悉 信号 的 人 们 来 说 ， 信 号 是 指 那些 被 异步 发 送 
到 一 个 程序 的 事件 。 在 称 认 情况 下 ， 它 们 通 第 会 终止 一 个 程序 的 


运行 。 


trap 命 令 有 两 个 参数 ， 第 一 个 参数 是 接收 到 指定 信号 时 将 要 采取 的 
行动 ， 第 二 个 参数 是 要 处 理 的 信号 名 。 

trap command signal 

请 记 住 ， 脚 本 程序 通常 是 以 从 上 到 下 的 顺序 解释 执行 的 ， 所 以 你 必 
须 在 你 想 保 护 的 那 部 分 代码 之 前 指定 trap 命 令 。 

如 果 要 重 置 某 个 信号 的 处 理 方式 到 其 默认 值 ， 只 需 将 command 设 置 
为 一 。 如 果 要 忽略 某 个 信号 ， 束 把 command 设 置 为 空 字符 串 ”"。 一 个 不 
和 带 参 数 的 trap 命 令 将 列 出 当前 设置 的 信号 及 其 行动 的 清单 。 

表 2-11 列 出 了 X/Open 规范 里 面 规定 的 能 够 被 捕获 的 比较 重要 的 一 些 
信号 《括号 里 面 的 数字 是 对 应 的 信号 编号 ) 。 更 多 细节 请 参考 Signal 在 
线 手 册 的 第 7 部 分 (man 7 signal) . 


表 2-11 


Se {eS Mb oH 
下 面 的 脚本 演示 了 一 些 简单 的 信号 处 理 方法 : 


sone 


“UR ERAN, 在 每 次 循环 时 按 下 Ctrl+C 组 合 键 (或 任何 你 
系统 上 设 定 的 中 断 键 ) ， 人 


Creating file sep my tmp _file 


press interrupt TRL- to interrupt ... 


þ þó það þat 
Dm i ® ® 
vb DD @ v 


© mm H , ) ) © 由 


实验 解析 

在 这 个 脚本 程序 中 ， 我 们 先 用 trap 命 令 安 排 它 在 出 现 一 个 INT CF 
Wr) 信号 时 执行 rm-frtmp/my_ tmp _file ”$$ 命令 删除 临时 文件 。 脚 本 程序 
然后 进入 一 个 while 循 环 ， 只 要 临时 文件 存在 ， 循 环 束 一 直 持 续 下 去 。 
用 户 按 下 Ctrl+C 组 合 键 时 ， 脚 本 程序 就 会 执行 rn-f /tmp/my_ tmp_ file_ 

语句 ， 然 后 继续 下 一 个 循环 。 因 为 临时 文件 现在 已 经 被 删除 了 ， 上 所 以 
= Nwhile 循 环 将 正常 退出 。 

接 下 来 ， 脚 本 程序 再 次 调用 trap 命 令 ， 这 次 是 指定 当 一 个 INT 信 和 号 
出 现时 不 执行 任何 命令 。 脚本 程序 然后 重新 创建 临时 文件 并 进入 第 二 个 
while 循 环 。 这 次 当 用 户 按 下 Ctrl+C 组 合 键 时 ， 没 有 语句 被 指定 执行 ， 所 
以 采取 默认 处 理 方 式 ， 即 立即 终止 脚本 程序 。 因 为 脚本 程序 被 立即 终止 
了 ， 所 以 最 后 的 echo 和 exit 语 名 永远 都 不 会 被 执行 。 


16. unset 

unset 命 令 的 作用 是 从 环境 中 删除 变量 或 函数 。 这 个 命令 不 能 删除 
shell 本 身 定义 的 只 读 变 量 ( 如 IFS) 。 这 个 命令 并 不 常用 。 

下 面 的 脚本 第 一 次 输出 字符 串 Hello World， 但 第 二 次 只 输出 一 个 换 
行 符 : 


使 用 foo= 语 句 产生 的 效果 与 上 面 脚本 中 的 unset 命 令 产 生 的 效 
果 差 不 多 ， 但 并 不 等 同 。foo= 语 句 将 变量 foo 设 置 为 空 ， 但 变量 foo 
仍然 存在 ， 而 使 用 unset foo 语句 的 效果 是 把 变量 foo 从 环境 中 删 
除 。 


17. 另外 两 个 有 用 的 命令 和 正则 表达 式 

在 学 习 如 何 应 用 shel 编 程 中 的 这 个 新 知识 点 之 前 ， 让 我 们 再 来 看 另 
外 两 个 非常 有 用 的 命令 ， 它 们 虽然 不 是 shell 的 一 部 分 ， 但 在 编写 shell 程 
序 时 经 常用 到 。 同 时 ， 我 们 也 将 介绍 正则 表达 式 ， 一 种 出 现在 所 有 


你 将 看 到 的 第 一 个 命令 是 find。 这 是 个 用 于 搜索 文件 的 命令 ， 它 极 
其 有 用 ， 但 Linux 初 学 者 常常 部 得 它 不 易 使 用 ， 这 不 仅仅 是 因为 它 有 选 
项 、 测 试 和 动作 类 型 的 参数 ， 还 因为 其 中 一 个 参数 的 处 理 结果 可 能 会 影 
啊 到 后 续 参 数 的 处 理 。 

在 深入 研究 这 些 选项 、 测 试 和 参数 之 前 ， 让 我 们 首先 看 一 个 非常 简 
单 的 例子 ， 它 用 来 在 本 地 机 器 上 得 找 名 为 test 的 文件 。 为 了 确保 你 具有 
搜索 整个 机 器 的 权限 ， 请 以 root 用 户 身 份 来 执行 这 个 命令 : 

# find / -name test -print 
/usr/bin/test 


+ 

根据 你 所 使 用 系统 的 不 同 ， 你 可 能 还 会 找到 其 他 几 个 名 称 也 为 test 
的 文件 。 正 如 你 可 能 猜测 的 那样 ， 这 个 命令 的 合 义 是 : JAR aaron 
找 名 为 test 的 文件 ， 并 且 输 出 该 文件 的 完整 路 径 。 这 非常 简单 。 


然而 ， 这 个 命令 的 执行 确实 需要 花费 很 长 的 时 间 ， 并 且 网 络 上 的 
Windows 机 器 的 硬盘 也 会 高 速 转动 。 这 是 因为 Linux 机 器 挂 载 〈 使 用 
SAMBA) 了 一 大 块 Windows 机 器 的 文件 系统 ， 看 起 来 似乎 是 Windows 
E E E A 


“这 就 是 我 们 要 介绍 的 第 一 个 选项 发 挥 作用 的 时 候 了 。 如 果 你 指定 - 
mount 选 项 ， 你 就 可 以 告诉 find 命 令 不 要 搜索 挂 载 的 其 他 文件 系统 的 目 
录 。 


# find / -mount -name test -print 
/usr/bin/test 
# 
我 们 仍然 能 找到 文件 ， 但 这 次 搜索 速度 会 更 快 ， 同 时 也 不 必 再 搜索 
挂 载 的 其 他 文件 系统 。 
find 命 令 的 完整 语法 格式 如 下 所 示 : 
find [path] [options] [tests] [actions] 
path 部 分 很 容易 理解 : 你 既 可 以 使 用 绝对 路 径 ， 如 /bin， 也 可 以 使 
用 相对 路 径 ， 如 .，。 如 果 需 要 ， 你 也 可 以 指定 多 个 路 径 ， 如 


find/var/home. 


find 命 令 有 许多 选项 可 用 ， 表 2-12 列 出 了 一 些 主要 的 选项 。 
表 2-12 


G x 


下 面 是 测试 部 分 。 可 以 提供 给 find 命 令 的 测试 非常 多 ， 每 种 测试 返 
回 的 结果 有 两 种 可 能 : true 或 false。find 命 令 开 始 工作 时 ， 它 按照 顺序 将 
定义 的 每 种 测试 依次 应 用 到 它 搜索 到 的 每 个 文件 上 。 如 果 一 个 测试 返回 
false, find 命 令 束 停止 处 理 它 当前 找到 的 这 个 文件 ， 并 继续 搜索 。 如 果 一 
个 测试 返回 true，find 命 令 将 继续 下 一 个 测试 或 对 当前 文件 采取 行动 。 表 
2-13 只 列 出 了 最 党 用 的 测试 ， 请 参考 find 命 令 的 手册 页 以 了 解 所 有 可 以 
使 用 的 测试 。 


表 2-13 


Mise eee 
eit, LEE Se as 


UE A USER TET RA iN. KE BERET AAPA CL: 短 格式 
和 长 格式 ， 如 表 2-14 所 示 。 


表 2-14 


操作 符 ， 短 格式 操作 符 ， 长 格式 _ 含 


你 可 以 通过 使 用 圆 括号 来 强制 测试 和 操作 符 的 优先 级 。 由 于 圆 括号 
对 shell 来 说 有 其 特殊 的 含义 ， 所 以 你 还 必须 使 用 反 和 斜 线 来 引用 圆 括 号 。 
此 外 ， 如 果 你 在 文件 名 处 使 用 的 是 匹配 模式 ， 你 就 必须 在 模式 上 使 用 引 
号 以 确保 模式 没有 航 shell 扩 展 ， 而 是 直接 传递 给 find 命 令 。 例 如 ， 如 果 
你 想 写 一 个 测试 “搜索 的 文件 比 文件 X 要 新 ， 或 者 文件 名 以 下 划 线 开 
头 ”， 你 可 以 这 样 写 : 


\(-newer X -o -name "_*" \) 


我 们 将 在 下 一 个 “实验 解析 ”部 分 之 后 举 这 样 一 个 例子 。 


实 验 使 用 带 测试 的 find 命 令 
在 当前 目录 下 搜索 比 文件 while2 要 新 的 文件 : 


$ find . -newer while2 -print 


f/elif3 
‘words .txt 
words2.txt 


这 个 结果 看 起 来 不 错 ， 不 过 在 结果 中 还 包括 了 当前 目录 ， 而 这 并 不 
是 你 想 要 的 ， 你 只 对 普通 文件 感 兴 趣 。 所 以 你 会 增加 一 个 额外 的 测试 - 
type f: 


$ find . -newer while2 -type f -print 


./_trap 

实验 解析 

它 是 如 何 工作 的 呢 ? 你 指定 find 命 令 应 该 在 当前 目录 C) 中 搜索 比 
文件 while2 要 新 的 文件 (-newer while2) ， 如 果 这 个 测试 通过 ， 然 后 再 
测试 这 个 文件 是 否 是 一 个 普通 文件 〈-type f) 。 最 后 ， 你 使 用 前 面 已 经 
讲 过 的 -print 来 确认 搜索 到 的 文件 。 

现在 来 查找 以 下 划 线 开头 的 文件 或 比 while2 文 件 要 新 的 文件 ， 但 在 
这 个 例子 将 演示 如 何 使 用 圆 括号 来 对 测 
试 进 行 组 合 : 


S find . 


-until 


可 以 看 出 完成 这 个 任务 并 不 是 很 困难 。 你 必须 转 义 圆 括号 使 得 它们 
不 会 被 shell 处 理 ， 而 且 还 需要 将 * 号 用 引号 括 起 使 得 它 被 直接 传递 给 find 
Hj o 

现在 你 已 可 以 可 靠 地 搜索 文件 了 。 下 面 来 看 看 在 发 现 匹配 指定 条 件 
的 文件 之 后 ， 你 可 以 执行 的 动作 。 表 2-15 只 列 出 了 最 常见 的 动作 ， 完 整 
的 动作 列表 请 见 find 命 令 的 手册 页 。 

-exec 和 -ok 命令 将 命令 行 上 后 续 的 参数 作为 它们 参数 的 一 部 分 ， 直 
到 被 序列 终止 。 实 际 上 ，-exec 和 -ok 命令 执行 的 是 一 个 租 入 式 命令 ， 所 
以 租 入 式 命 令 必 须 以 一 个 转 义 的 分 号 结束 ， 使 得 find 命 令 可 以 决定 什么 
时 候 它 可 以 继续 碍 找 用 于 它 上 自己 的 命令 行 选项 。 魔 术 字 符 串 {}。 是 -exec 
或 -ok 命令 的 一 个 特殊 类 型 的 参数 ， 它 将 被 当前 文件 的 完整 路 径 取 代 。 


表 2-15 


上 面 的 解释 可 能 并 不 容易 理解 ， 但 通过 一 个 例子 可 以 将 其 解释 得 更 
清楚 。 我 们 来 看 一 个 比较 简单 的 例子 ， 它 使 用 一 条 非常 安全 的 命令 Is: 


3 find . -newer while2 -type f -exec ls -l {} \; 


如 你 所 见 ，find 命 令 非常 有 用 。 你 只 需 通过 一 点 练习 就 可 以 很 好 地 
掌握 它 。 无 论 如 何 ， 这 点 练习 是 完全 值得 的 ， 所 以 请 使 用 find 命 令 来 进 
行 实验 。 


° 外 ep 命令 

我 们 将 介绍 的 第 二 个 非常 有 用 的 命令 是 grep， 这 个 不 寻常 的 名 字 代 
表 的 是 通用 正则 表达 式 解 析 器 (General Regular Expression Parser， 简 写 
为 grep) 。 你 使 用 find 命 令 在 系统 中 搜索 文件 ， 而 使 用 grep 命 令 在 文件 中 
搜索 字符 串 。 事 实 上 ， 一 种 非常 常见 的 用 法 是 在 使 用 find 命 令 时 ， 将 
grep 作 为 传递 给 -exec 的 一 条 命令 。 

grep 命 令 使 用 一 个 选项 、 一 个 要 匹配 的 模式 和 要 搜索 的 文件 ， 它 的 
语法 如 下 所 示 : 


grep [options] PATTERN [FILES] 


如 果 没 有 提供 文件 名 ， 则 grep 命 令 将 搜索 标准 输入 。 
我 们 首先 来 查看 grep 命 令 的 一 些 主 要 选项 ， 它 们 列 在 了 表 2-16 中 ， 
完整 的 选项 列表 请 见 grep 命 令 的 手册 页 。 


表 2-16 


选 2 = x 


K 验 基本 的 grep 命 令 用 法 
我 们 来 看 一 些 使 用 grep 命 令 的 简单 例子 : 
$ grep in words.txt 


When shall we three meet again. In thunder, lightning, or in rain? 
I com Graymalkin! 

$ grep -c in words.txt words2.txt 

words2.txt:14 

$ grep -c -v in words.txt words2.txt 

words .txt:9 


words2.txt:16 


实验 解析 
第 一 个 例子 未 使 用 选项 ， 它 只 是 在 文件 words，txt 中 搜索 字符 串 i， 

然后 输出 匹配 的 行 。 文 件 名 未 输出 是 因为 你 只 在 一 个 文件 中 进行 搜索 。 
第 二 个 例子 在 两 个 不 同 的 文件 中 计算 匹配 行 的 数目 。 在 这 种 情况 

下 ， 文 件 名 被 输出 。 

， 最 后 一 个 例子 使 用 -选项 对 搜索 取 反 ， 在 两 个 文件 中 计算 不 匹配 和 


. 正则 表达 式 

正如 你 所 看 到 的 ，grep 命 令 的 基本 用 法 非常 容易 掌握 。 现 在 是 时 候 
介绍 正则 表达 式 的 基础 知识 了 ， 它 允许 你 实现 更 复杂 的 匹配 。 正 如 我 们 
在 本 章 前 面 提 到 的 那样 ， 正 则 表达 式 被 广泛 应 用 于 Linux 和 许多 其 他 开 
源 编程 语言 中 。 你 可 以 在 vi 编辑 器 或 Perl 脚 本 中 使 用 它们 ， 而 且 不 论 它 
们 出 现在 哪里 ， 其 基本 原理 都 是 一 样 的 。 

在 正则 表达 式 的 使 用 过 程 中 ， 一 些 字符 是 以 特定 方式 处 理 的 。 最 党 
使 用 的 特殊 字符 如 表 2-17 所 示 。 


® 2-17 
字 F = 义 
whe TAA 
任意 单个 字符 
HIE ia FRM, Weep ZAR | Haase WEZ 


4 bk | a | f TRYS As ta 
AUN OR ERER AFORM., AOAC Ne AP 7. 


如 条 想 将 上 述 字符 用 作 普 通 字符 ， 束 需要 在 它们 前 面 加 上 \ 字 符 。 
例如 ， 如 果 想 使 用 芷 字符， 你。 需要 将 它 写 为 \$. 
在 方 括 号 中 还 可 以 使 用 一 些 有 用 的 特殊 匹配 模式 ， 如 表 2-18 所 示 。 


CRR = x 
T= 7 5MPETR 
rh} 
ASCIVS 77 
HRA 
ASCII ® 
e 
ie K 
( 续 ) 
匹配 模 t x 
hy 7H 
tar? 
村 于 号 和子 时 
TPM. CARUK 
i 
is AMY 


另外 ， 如 采 指 定 了 用 于 扩展 匹配 的 -E 选 项 ， 那 些 用 于 控制 匹配 完成 
的 其 他 字符 可 能 会 遵循 正则 表达 式 的 规则 《〈 见 表 2-19) 。 对 于 grep 命 令 
来 说 ， 我 们 还 需要 在 这 些 字符 之 前 加 上 \ 字 符 。 


表 2-19 


ZARA 
3 和 
ox ~ 4 z% x 

上 

ee 

x 


å 
na Ta 
ri 
4 


MEXA En m, Anm 


这 看 上 去 有 点 复杂 ， 但 如 果 你 实际 应 用 它 ， 将 会 友 现 它 并 不 像 第 一 
眼看 上 去 那么 复杂 。 掌 握 正 则 表达 式 的 最 简单 方法 就 是 答 试 一 些 实验 。 
(1) 我 们 的 第 一 个 例子 是 查找 以 字母 e 结 尾 的 行 。 你 可 能 会 猿 到 需 
要 使 用 特殊 字符 节 ， 如 下 所 示 : 
$ grep e$ words2.txt 


Art thou not, fatal vision, sensible 


I see thee yet, in form as palpable 
Nature seems dead, and wicked dreams abuse 


如 你 所 见 ， 这 个 命令 找到 了 以 字母 e 结 尾 的 行 。 
(2) 现在 假设 想 要 查找 以 字母 结尾 的 单词 。 要 完成 这 一 任务 ， 你 
需要 使 用 方 括 号 括 起 的 特殊 匹配 字符 。 在 本 例 中 ， 你 将 使 用 的 是 
[[:blank:]]， 它 用 来 测试 空格 或 制 表 符 : 


$ grep a[[:blank:]] words2.txt 


Is this a dagger which I see before me, 
A dagger of the mind, a false creation, 
Moves like a ghost. Thou sure and firm-set earth, 


(3) 下 面 我 们 来 查找 以 Th 开头 的 由 3 个 字母 组 成 的 单词 。 在 本 例 
中 ， 你 既 需 要 使 用 [[: space: ]] 来 划 定 单词 的 结尾 ， 还 需要 用 字符 〈.) 来 
匹配 一 个 额外 的 字符 : 


$ grep Th.[[:space:]] words2.txt 


The handle toward my hand? Come, let me clutch thee. 
The curtain'd sleep; witchcraft celebrates 
Thy very stones prate of my whereabout, 


(4) 最后， 我 们 用 扩展 grep 模 式 来 搜索 只 有 10 个 字符 长 的 全 部 由 
小 写字 母 组 成 的 单词 。 我 们 通过 指定 一 个 匹配 字母 a 到 z 的 字符 范围 和 一 
个 重复 10 次 的 匹配 来 完成 这 一 任务 : 


$ grep -E [a-z]\{10\} words2.txt 


Proceeding from the heat-oppressed brain? 
And such an instrument I was to use. 

The curtain'd sleep; witchcraft celebrates 
Thy very stones prate of my whereabout, 

se 


我 们 在 这 里 只 涉及 了 正则 表达 式 中 最 重要 的 内 容 。 与 Linux 中 大 多 
数 事物 一 样 ， 系 统 中 的 大 量 文 档 可 以 帮助 你 了 解 更 多 的 细节 ， 但 学 习 正 
则 表达 式 最 好 的 方法 是 实际 操作 。 


2.6.6 ”命令 的 执行 


编写 脚本 程序 时 ， 你 经 常 需要 捕获 一 条 命令 的 执行 结果 ， 并 把 它 用 
在 shell 脚 本 程序 中 。 也 就 是 说 ， 你 想 要 执行 一 条 命令 ， 并 把 该 命令 的 输 
出 放 到 一 个 变量 中 。 

你 可 以 用 在 本 章 前 面 set 命 令 示例 中 介绍 的 半 (command) 语法 来 实 
现 ， 也 可 以 用 一 种 比较 老 的 语法 形式 ‘command*， 这 种 用 法 目前 依然 很 
凶 见 。 


请 注意 ， 在 脚本 程序 里 执行 命令 的 比较 老 的 语法 形式 时 ， 使 
用 的 是 反 引 和 号“*〉 ， 而 不 是 我 们 在 前 面 使 用 的 单 引 号 C) C 


引号 的 作用 是 防止 变量 扩展 ) 。 只 有 当 你 需要 使 自己 的 脚本 程序 
具备 非常 好 的 可 移植 性 时 ， 你 才 应 该 使 用 这 种 比较 老 的 方法 。 


所 有 的 新 脚本 程序 都 应 该 使 用 闻 C.. 形式 ， 引 入 这 一 形式 的 目的 
是 为 了 避免 在 使 用 反 引 号 执行 命令 时 ， 处 理 其 内 部 的 $ 、`” 、\ 等 字符 所 
需要 应 用 的 相当 复杂 的 规则 。 如 果 在 反 引 号 `.… 结 构 中 需要 用 到 反 引 
写 ， 它 训 必 须 通 过 \ 字 符 进 行 转 义 。 这 些 相 对 星 深 的 字符 往往 会 让 程序 
员 感 到 困惑 ， 有 时 即使 是 经 验 丰 富 的 shell 脚 本 程序 员 也 必须 反复 进行 实 
验 ， 才 能 确保 在 反 引 号 命令 中 引号 的 使 用 不 会 出 错 。 

$ Ccommand) 的 结果 就 是 其 中 命令 的 输出 。 注 意 ， 这 不 是 该 命令 
的 退出 状态 ， 而 是 它 的 字符 串 形式 的 输出 结果 。 例 如 : 


因为 当前 目录 是 一 个 shell 环 境 变 量 ， 所 以 程序 的 第 一 行 不 需要 使 用 
这 个 命令 执行 结构 。 但 如 果 我 们 想 要 在 脚本 程序 中 使 用 who 命 令 的 输出 
结 末 ， 就 再 要 使 用 这 个 结构 。 

如 末 想 要 将 命令 的 结果 放 到 一 个 变量 中 ， 你 可 以 按 通 闸 的 方法 来 给 
CIE, YOR Aras: 


whoisthere=$S$ (who) 
echo Swhoisthere 


这 种 把 命令 的 执行 结果 放 到 变量 中 的 能 力 是 非常 强大 的 ， 它 使 得 在 
脚本 程序 中 使 用 现 有 命令 并 捕获 其 输出 变 得 很 容易 。 如 果 需 要 把 一 条 命 
令 在 标准 输出 上 的 输出 转换 为 一 组 参数 ， 并 且 将 它们 用 做 为 另 一 个 程序 
ee ee E er re 
J 于 册页 。 

有 时 ， 当 你 打算 调用 的 命令 在 输出 你 想 要 的 内 容 之 前 先 输出 了 一 些 
空白 字符 ， 或 者 它 输出 的 内 容 比 你 想 要 的 要 多 的 时 候 也 会 出 现 问题 。 此 
时 ， 你 可 以 用 前 面 介 绍 的 set 命 令 来 解决 。 

1. 算术 扩展 

我 们 已经 介绍 过 expr 命 令 ， 通 过 它 可 以 处 理 一 些 简单 的 算术 命令 ， 
但 这 个 命令 执行 起 来 相当 慢 ， 因 为 它 需 要 调用 一 个 新 的 shell 来 处 理 expr 

3 


ay 
D 


一 种 更 新 更 好 的 办 法 是 使 用 $〈 〈.…) ) 扩展 。 把 你 准备 求 值 的 表 


2 


IATMTETES CC...) ) 中 能 够 更 有 效 地 完成 简单 的 算术 运算 。 如 下 所 


ZN: 


注意 ， 这 与 命令 不 同 ， 两 对 圆 括号 用 于 算术 答 换 ， 而 我 们 之 
前 见 到 的 一 对 圆 括号 用 于 命令 的 执行 和 获取 输出 。 


2. 参数 扩展 
你 已 经 见 过 形式 最 简单 的 参数 赋值 和 扩展 了 ， 如 下 所 示 : 


foorfre 


但 当 你 想 在 变量 名 后 附加 额外 的 字符 时 就 会 遇 到 问题 。 假 设 你 想 编 
写 一 个 简短 的 脚本 程序 ， 来 处 理 名 为 1 tmp 和 2_tmp 的 两 个 文件 。 你 可 能 
会 这 样 写 : 

#!/bin/sh 


fortrin 1-2 
do 
my_secret_process $i_tmp 
done 
但 是 在 每 次 循环 中 ， 你 都 会 看 到 如 下 所 示 的 出 错 信息 : 


my_secret process: too few arguments 


哪里 出 错 了 呢 ? 

问题 在 于 shell 试 图 替换 变量 Yi tmp 的 值 ， 而 这 个 变量 其 实 并 不 存 
在 .shell 并 不 会 认为 这 是 一 个 错误 ， 仅 仅 会 将 它 替 换 为 一 个 空 值 ， 因 此 根 
本 不 会 有 参数 被 传递 给 my _ ”secret ”process。 为 了 保护 变量 名 中 类 似 于 
站 i 部 分 的 扩展 ， 你 需要 把 i 放 在 花 括号 中 ， 如 下 所 示 : 


¢!/bin/sh 


for 
do 

secret_process 
done 


在 每 次 循环 中 ， 变 量 i 的 值 替 换 了 $ (i) ， 从 而 给 出 正确 的 文件 名 。 
也 就 是 说 ， 你 把 参数 的 值 替 换 进 了 一 个 字符 串 。 

你 可 以 在 shell 中 采用 多 种 参数 替换 方法 。 对 于 多 参数 处 理 问题 来 
说 ， 这 些 方法 通常 会 提供 一 种 精巧 的 解决 方案 。 表 2-20 列 出 了 一 些 常见 
的 参数 扩展 方法 。 


参数 扩展 说 二 

v mer 7 ano a Bi ah de 
eh 配 的 最 小 邦人 分， 然后 返回 科 余 ; 
Fs VAMC. Reel aee 
eR! 匹配 的 最 小 部 分 ， 然 后 返回 利 余 让 
Si i 配 的 最 长 部 分 ， 然 后 返回 科 余 部 


当 处 理 字符 串 时 ， 这 些 丛 换 通 种 是 很 有 用 的 。 特 别 是 上 表 中 对 字符 
串 进 行 部 分 删除 的 最 后 4 个 参数 扩展 方法 ， 在 处 理 文件 名 和 路 径 时 非常 
有 用 ， 请 看 下 面 的 例子 。 


实 验 参数 的 处 理 
下 面 脚本 程序 的 各 个 部 分 分 别 演示 了 各 种 参数 匹配 操作 符 的 用 法 : 


它 的 输出 结果 如 下 : 


bar 

fud 

usr/bin/X11/startx 

startx 

/usr/local/etc 

/usr 

实验 解析 

第 一 条 语句 ${foo: ”-bar} 给 出 的 值 是 bar， 这 是 因为 在 这 条 语句 执行 
oo 这 条 语句 执行 后 ， 变 量 foo 未 发 生变 化 ， 它 还 停留 在 未 设 


如 果 这 条 语句 是 $ffoo: =bar}， 那 么 变 f foo 就 会 被 赋值 。 这 个 
字符 串 操 作 符 的 作用 是 ， 检 查 变量 foo 是 否 存 在 且 不 为 空 。 如 果 它 
as 就 返回 它 的 值 ， 否 则 就 把 变量 foo 赋 值 为 bar 并 返回 这 个 

$ {foo: ? bar} 语 句 将 在 变量 foo 不 存在 或 它 设置 为 空 的 情况 
下 ， 输 出 foo: bar 并 异常 终止 脚本 程序 。 最 后 ，$ {foo: +bar} 语 句 
将 在 变量 foo 存 在 且 不 为 空 的 情况 下 返回 bar。 选 择 可 太 多 了 ! 


{foo#*/} 语 句 仅 仪 匹 配 并 删除 最 左边 的 / 《〈 记 住 ，* 匹 配 零 个 或 多 个 
字符 ) 。{foo 棒 */} 语 句 匹 配 并 删除 尽 可 能 多 的 字符 ， 所 以 它 删 除 最 右边 
的 /及 其 前 面 的 所 有 字符 。 

{bar%local*} 语 名 匹配 从 右边 起 直到 第 一 次 出 现 local 《及 跟 在 它 后 
面 的 所 有 字符 ) ， 而 {bar:%%6local*} 语 句 则 从 右边 起 尽 可 能 多 地 匹配 字 
符 ， 直 到 遇 到 最 靠 左 边 的 local。 

因为 UNIX 和 Linux 系 统 都 非常 依赖 过 滤器 的 思想 ， 所 以 一 个 操作 的 
结果 名 党 必须 手工 进行 重 定向 。 假 设 你 想 使 用 cjpeg 程 序 将 一 个 GIF 文件 
转换 为 一 个 JPEG 文 件 : 


$ cjpeg image.gif > image.jpg 
但 有 时 ， 你 可 能 希望 对 大 量 文件 执行 这 类 操作 ， 那 么 如 何 实现 自动 
重 定 向 呢 ? 很 简单 ， 像 下 面 这 样 做 即 可 : 


t!/bin/sh 
for ínage in *.gif 


age > ${imagettgif)ipg 


这 个 脚本 名 为 giftojpeg， 它 为 当前 目录 中 的 每 个 GIF 文件 创建 一 个 
对 应 的 JPEG 文 件 。 


2.6.7 here <4 


在 shell 脚 本 程序 中 同一 条 命令 传递 输入 的 一 种 特殊 方法 是 使 用 here 
文档 。 它 允许 一 条 命令 在 获得 输入 数据 时 就 好 像 是 在 读 取 一 个 文件 或 键 
盘 一 样 ， 而 实际 上 是 从 脚本 程序 中 得 到 输入 数据 。 

here 文 档 以 两 个 连续 的 小 于 号 << 开 始 ， 紧 跟着 一 个 特殊 的 字符 序 
列 ， 该 序列 将 在 文档 的 结尾 处 再 次 出 现 。<< 是 shell 的 标签 重 定 向 符 ， 在 
这 里 ， 它 强制 命令 的 输入 是 一 个 here 文 档 。 这 个 特殊 字符 序列 的 作用 就 
像 一 个 标记 ， 它 告诉 shell here 文 档 结束 的 位 置 。 因 为 这 个 标记 序列 不 能 
E E 
\ 寻 常 。 


实 验 使 用 here 文 档 
最 简单 的 例子 就 是 给 cat 命 令 提 供 输入 数据 ， 如 下 所 示 : 


D2n/ Sn 


它 的 输出 如 下 所 示 : 
hello 
this is a here 
document 

here 文 档 功 能 可 能 看 起 来 相当 奇怪 ， 但 其 实 它 的 作用 很 大 。 因 为 它 
可 以 用 来 调用 交互 式 的 程序 ， 比 如 一 个 编辑 器 ， 并 向 它 提供 一 些 事先 定 
义 好 的 输入 。 但 它 更 常见 的 用 途 是 在 脚本 程序 中 输出 大 量 的 文本 ， 整 像 


你 在 刚才 的 示例 中 看 到 的 那样 ， 从 而 可 以 避免 用 echo 语 句 来 输出 每 一 
行 。 你 可 以 在 标识 符 两 问 都 使 用 感叹 号 〈! ) 来 确保 不 会 引起 混 消 。 


如 末 想 按 预 定 的 方式 处 理 一 个 文件 中 的 几 行 ， 你 可 以 使 用 ed 行 编辑 
器 ， 并 在 脚本 程序 中 通过 here 文 档 向 它 提 供 命令 。 


实验 here 文 档 的 另 一 个 用 法 
(1) 我 们 从 名 为 a_text_file 的 文件 开始 ， 它 的 内 容 如 下 所 示 : 


(2) 你 可 以 通过 结合 使 用 here 文 要 和 ed 编辑 器 来 编辑 这 个 文件 : 


file <<!PunkyStuft 


运行 这 个 脚本 程序 ， 现 在 这 个 文件 的 内 容 是 : 
That is line 1 

That is line 2 

That was line 4 


实验 解析 

这 个 脚本 程序 只 是 调用 ed 编辑 需 并 问 它 传递 命令 ， 先 让 和 它 移 动 到 第 
三 行 ， 然 后 删除 该 行 ， 再 把 当前 行 〈 因 为 第 三 行 刚刚 被 删除 了 ， 所 以 当 
前 行 现 在 就 是 原来 的 最 后 一 行 ， 即 第 四 行 ) 中 的 is 丛 换 为 was。 完 成 这 
些 操作 的 ed 命令 来 自 脚本 程序 中 的 here 文 档 一 一 在 标记 ! FunkyStuff! 


之 间 的 那些 内 容 。 


注意 ， 我 们 在 here 文 档 中 用 \ 字 符 来 防止 六 字符 被 shell 扩 展 。 
\ 字 符 的 作用 是 对 于 进行 转 义 ， 让 shell 知 道 不 要 尝试 把 站 3/is/was/ 
扩展 为 它 的 值 ， 而 它 也 确实 没有 值 .shell 把 \$ 传 递 为 $， 再 由 ed 编辑 
器 对 它 进 行 解释 。 


2.6.8 ”调试 脚本 程序 


脚本 程序 的 调试 通常 都 很 容易 ， 但 并 没有 特定 的 工具 帮助 我 们 进行 
调试 。 在 本 节 中 ， 我 们 将 简单 讲述 一 些 常 用 的 方法 。 

出 现 错误 时 ，shell 一 般 都 会 打印 出 包含 错误 的 行 的 行 号 。 如 果 这 个 
错误 并 不 是 非常 明显 ， 你 可 以 添加 一 些 额 外 的 echo 语 句 来 显示 变量 的 内 
容 ， 也 可 以 通过 在 shell 中 交互 式 地 输入 代码 片段 来 对 它们 进行 测试 。 

因为 脚本 程序 是 解释 执行 的 ， 所 以 在 脚本 程序 的 修改 和 重 试 过 程 中 
没有 编译 方面 的 额外 开支 。 跟 中 脚本 程序 中 复杂 错误 的 主要 方法 是 设置 
各 种 shell 选 项 。 为 此 ， 你 可 以 在 调用 shell 时 加 上 命令 行 选项 ， 或 是 使 用 
set 命 令 。 表 2-21 列 出 了 各 种 选项 。 


r 2-21 


命令 行 选项 got 选项 说 请 


你 可 以 用 -o 选 项 启用 set 命 令 的 选项 标志 ， 用 +o 选 项 取消 设置 ， 对 简 
写 版 本 也 是 一 样 的 处 理 方法 。 你 可 以 通过 使 用 xtrace 选 项 来 得 到 一 份 简 
单 的 执行 跟踪 报告 。 在 调试 的 初始 阶段 ， 你 可 以 先 使 用 命令 行 选项 的 方 
法 ， 但 如 果 想 获得 更 好 的 调试 效果 ， 你 可 以 将 xtrace 标 志 【〔 用 来 启用 或 
关闭 执行 命令 的 跟 踊 〉 放 到 脚本 程序 中 问题 代码 的 前 后 。 执 行 跟踪 功能 
让 shell 在 执行 每 行 语句 之 前 ， 先 输出 该 行 并 对 该 行 中 变量 进行 扩展 。 

使 用 下 面 的 命令 来 启用 xtrace 选 项 : 
set -o xtrace 

再 用 下 面 的 命令 来 关闭 xtrace 选 项 : 
set +o xtrace 

默认 情况 下 ， 变 量 扩展 的 层次 由 每 行 代 码 前 的 + 号 个 数 指出 。 你 可 
以 通过 对 shell 配 置 文件 中 的 shell 变 量 PS4 进 行 设置 ， 将 + 号 修改 为 更 有 意 
义 的 字符 。 

在 shell 中 ， 你 还 可 以 通过 捕获 EXIT 信 号 ， 从 而 在 脚本 程序 退出 时 查 
看 到 程序 的 状态 。 有 具体 做 法 是 在 脚本 程序 的 开始 处 添加 类 似 下 面 这 样 的 


一 条 语句 : 


trap ‘echo Exiting: critical variable = $critical_variable' EXIT 


2.7 HI I: dialog LE 


在 结束 讨论 shell 脚 本 程序 之 前 ， 我 们 还 将 介绍 一 个 特性 。 尽 管 严 格 
来 说 ， 它 并 不 是 shell 的 一 部 分 ， 但 是 在 通常 情况 下 ， 它 仪 仪 在 shell 程 友 
设计 中 有 用 ， 所 以 我 们 将 在 这 里 讨论 它 。 

如 果 你 知道 你 的 脚本 程序 只 需要 运行 在 Linux 控 制 侣 上， 则 可 以 使 
用 dialog 工 具 命 令 ， 它 以 一 种 非常 整洁 的 方式 润色 你 的 脚本 程序 。 这 个 
ee ee ee eee 
决 方案 。 


一 些 Linux 发 行 版 默认 并 没有 安装 dialog 工 具 。 例 如 ， 对 于 
Ubuntu 来 说 ， 你 可 能 必须 添加 公开 维护 的 套件 库 来 找到 一 个 现成 
的 版 本 。 在 其 他 Linux 发 行 版 中 ， 你 可 能 会 找到 一 个 已 安装 的 蔡 代 
工具 gdialog。 它 和 dialog 工 具 非 常 相似 ， 但 它 依 赖 GNOME 用 户 接 
口 来 显示 其 对 话 框 。 然 而 ， 你 得 到 的 回报 是 你 获得 了 一 个 真正 的 
图 形 化 界面 。 一 般 来 说 ， 你 可 以 将 任何 使 用 dialog 工 具 的 程序 中 对 
dialog 工 具 的 调用 替换 为 对 gdialog 工 具 的 调用 ， 从 而 获得 程序 的 一 
E 
列 。 


dialog 工 具 的 整体 思想 非常 简单 : 一 个 带 有 各 种 各 样 参数 和 选项 的 
程序 ， 它 可 以 显示 各 种 类 型 的 图 形 框 ， 范 围 涵 盖 从 最 简单 的 Yes/No 框 到 
输入 框 ， 甚 至 人 单 选项 。 这 个 工具 通 冲 在 用 户 执行 某 种 类 型 的 输入 后 返 
回 ， 返 回 结果 可 以 通过 退出 状态 获得 ， 或 在 用 户 输入 文本 时 ， 通 过 标准 
错误 流 来 获取 。 

在 详细 介绍 它 之 前 ， 我 们 先 来 看 一 个 非常 简单 的 使 用 dialog 的 例 
子 。 你 可 以 在 命令 行 上 直接 使 用 dialog， 这 对 于 程序 的 原型 设计 很 有 
现在 让 我 们 创建 一 个 简单 的 消息 框 ， 来 显示 传统 意义 上 的 第 一 个 程 
Fs 
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执行 它 就 会 在 屏幕 上 显示 一 个 图 形 化 的 消息 框 ， 你 可 以 通过 OK 对 
话 框 关闭 它 〈 见 图 2-3) . 

现在 你 已 看 出 dialog 的 使 用 非常 容易 ， 接 下 来 我 们 对 它 的 各 种 可 能 
性 进行 详细 地 介绍 。 表 2-22 列 出 了 你 可 以 创建 的 对 话 框 的 主要 类 型 。 


表 2-22 


类 于 用 于 创建 类 型 的 进项 3 x 
aT. klis CFIP ER PERRE., APENRE ENA 
信息 要 infobox 在 显示 消息 后 ， Mes raul. | RWE 
HAN PRAKA 
KNE j 户 选择 列表 中 的 
men 向 用 户 暴 示 一 条 消息 ， 网 时 明示 一 个 OK 按 饭 ， 用 户 可 以 通过 选择 读 
ILE He fi 
Nighi diolist CFR RRAPI AEN 
六 本 框 artbox UEP ERRA a p 
Erg KFR RE. ME LE yesi&e 


还 有 一 些 其 他 的 对 话 框 类 型 “例如 ， 进 度 框 和 密码 框 ) H. WR 


你 想 了 解 更 多 不 第 用 的 对 话 框 类 型 ， 你 也 可 以 参考 在 线 手册 页 。 

如 琳 想 获得 任何 类 型 的 允许 文本 输入 或 进行 选择 的 对 话 框 的 输出 ， 
你 必须 捕获 标准 错误 流 ， 通 党 是 把 它 指 问 某 个 临时 文件 以 便 后 续 处 理 。 
要 想 获得 Yes/No 对 话 框 的 输出 结果 ， 只 需 碍 看 它 的 退出 码 ， 与 所 有 设计 
i ee 
败 。 

所 有 的 对 话 框 类 型 部 有 各 种 各 样 的 用 于 控制 的 参数 ， 比 如 控制 显示 
的 对 话 框 的 大 小 和 形状 。 我 们 首先 列 出 每 种 类 型 需要 的 参数 见 表 2- 
23) ， 然 后 在 命令 行 上 演示 其 中 一 部 分 参数 的 用 法 。 最 后 ， 你 将 看 到 一 
个 简单 的 将 几 种 对 话 框 结合 起 来 的 程序 。 


表 2-23 


除 此 之 外 ， 所 有 的 对 话 框 类 型 都 有 几 个 相同 的 参数 选项 。 在 此 我 们 
不 一 一 列 出 ， 只 介绍 两 个 选项 : --title 和 -clear。 前 者 用 于 指定 对 话 杠 的 
标题 ， 后 者 用 来 完成 清 屏 操作 。 完 整 的 选项 列表 请 查询 手册 页 。 


K 验 使 用 dialog 工 具 

让 我 们 直接 跳 到 一 个 很 复杂 的 例子 。 一 旦 你 理解 了 这 个 例子 ， 所 有 
其 他 的 程序 就 非常 简单 了 ! 在 这 个 例子 中 ， 你 将 创建 一 个 标题 为 Check 
me 的 复 选 枉 ， 它 包括 一 条 提示 信息 Pick Numbers。 复 选 框 高 15 字 符 ， 宽 
25 字 符 ， 每 个 选项 高 3 个 字符 。 最 后 ， 你 列 出 要 显示 的 选项 并 设置 了 款 
认 的 开关 选择 。 
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ones 


图 2-4 显 示 了 该 命令 执行 的 结果 。 

实验 解析 

在 本 例 中 ，--checklist 参 数 用 于 创建 一 个 复 选 枉 。--title 选 项 将 标题 
设置 为 Check me， 下 一 个 参数 是 提示 信息 Pick Numbers. 

你 接 下 来 设置 对 话 框 的 大 小 。 它 高 15 行 ， 宽 25 个 字符 ，3 行 被 用 于 
琳 持 。 这 个 大 小 并 不 是 最 合适 的 ， 但 是 你 可 以 从 中 看 到 内 容 的 排列 方 


Ts 

选项 的 设置 看 上 去 有 点 棘手 ， 但 你 只 需要 记 住 每 个 全 单 选项 有 3 个 
值 : 

O 编写; 

O MA; 

O 状态 。 


第 一 个 集 单 项 的 编号 是 1， 显 示 的 文本 是 one， 状 态 设 置 为 off。 第 二 
全 单项 的 值 分 别 是 2、two 和 选中 。 依 次 继续 直到 荣 单项 设置 完毕 。 
是 不 是 很 容易 ?你 可 以 在 命令 行 上 尝试 一 下 ， 看 看 它 的 使 用 有 多 人 么 


简单 。 为 了 能 将 这 些 放 在 一 个 程序 中 ， 你 需要 能 够 访问 用 户 输 入 的 结 
果 。 这 一 点 很 容易 实现 ， 对 于 文本 输入 ， 你 只 需要 重 定向 标准 错误 流 或 
检查 环境 变量 芋 ? A Y? 的 值 实际 上 就 是 前 一 个 命令 的 退出 状 
态 。 


K w: 一 个 更 复杂 的 使 用 dialog 工 具 的 程序 

我 们 来 看 一 个 名 为 questions 的 简单 程序 ， 它 关注 用 户 的 啊 应 : 

D 首先 ， 该 程序 通过 显示 一 个 简单 的 对 话 框 来 告诉 用 户 发 生 的 
RO R 
I 友好 : 


(2) 然后 用 一 个 简单 的 yes/mno 对 话 框 来 询问 用 户 是 否 要 继续 操作 。 
我 们 用 环境 变量 ¥? 来 检查 用 户 是 否 选 择 了 yes (返回 码 是 0) 。 如 采用 
户 不 想 继续 操作 ， 就 使 用 一 个 简单 的 信息 框 显 示 信 息 ， 信 息 框 在 退出 之 
前 不 需要 用 户 的 输入 。 


if ( $? t= 0 }; then 
infobox "Thank you anywa 


Glalog 
sleep 2 
i 


(3) Baar BE -DAERA Ta) FE EA 2 BE I oes RU 
到 临时 文件 一 1. txt， 然 后 再 将 它 放 到 变量 Q_NAME 中 : 


(4) 现在 显示 一 个 淋 蛙 ， 它 有 4 个 不 同 的 选项 。 你 再 次 重 定 癌 标准 
错误 流 并 且 把 它 装载 到 一 个 变量 中 : 


O) 用 户 选 择 的 亲 单 项 编写 将 被 保存 到 临时 文件 _1. txt 中 ， 同 时 这 
个 结果 被 放 入 变量 Q_MUSIC 中 ， 以 便 你 对 结果 进行 测试 : 


dialog --title “Likes Classical” msgbox “Good choice 


dialog title "Doesn't like Classical" msqbox "Shame" 


(6) 最 后 ， 清 除 对 话 框 并 退出 程序 : 


sleep 2 
dialog --clear 


exit 0 
图 2-5 显 示 了 屏幕 上 的 输出 信息 。 
实验 解析 


本 例 通过 将 dialog 命 令 和 一 些 简单 的 shell 编 程 语句 相 结合 ， 讲 解 了 
如 何 仅仅 使 用 shell 脚 本 来 构建 简单 的 GUI 程序 。 程 序 从 一 个 简单 的 欢迎 
页 面 开 始 ， 然 后 使 用 一 个 简单 的 --yesno 对 话 框 询问 用 户 是 否 愿意 继续 操 
作 。 程 序 使 用 变量 $3 来 检查 用 户 的 回答 。 如 果 用 户 同意 ， 程 序 将 获得 用 
户 的 姓名 并 将 它 保存 在 变量 Q_ NAME 中 ， 然 后 使 用 --menu 对 话 框 询问 
用 户 喜欢 哪 种 类 型 的 音乐 。 通 过 将 用 户 选 择 的 荣 单项 编号 保存 到 变量 
Q_MUSIC 中 ， 程 序 可 以 看 到 用 户 的 回答 并 给 出 适当 的 回应 。 
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图 2-5 


如 果 你 运行 的 是 一 个 基于 GNOME 的 GUI， 并 且 正 在 使 用 它 提供 的 
终端 会 话 ， 你 就 可 以 使 用 gdialog 命 令 来 代 蔡 dialog。 这 两 个 命令 有 着 相 
同 的 参数 ， 因 此 你 只 需 将 调用 的 命令 从 dialog 改 为 gdialog 即 可 ， 其 他 的 
代码 完全 不 需 改动 。 图 2-6 显 示 了 在 Ubuntu 系统 中 ， 使 用 上 面 脚本 程序 
的 gdialog 版 本 时 ， 屏 幕 的 输出 结果 。 


a riCkK@UDUNTU-HNS 1: ~/bipde/chapo2 


fle Ed View Terminal Tabs Help 
rick@Ubuntu RNS1:-/Dipsc/chape2$ ./qquestions 
eo RNS1: /bip4e/chopO2$ ./gquestions 


EHP Heme trom ie le 


Select items from the list below. 
v Rick, what music do you like bast? 
Classica! 
jazz 


Country 
Othar 


| X Gencel | | eax 


这 是 从 一 个 脚本 程序 中 生成 可 用 的 GUI 界面 的 非常 简单 的 方法 。 


2.8 ”综合 应 用 


人 至此， 你 已 学 习 完 作为 程序 设计 语言 的 shell 的 主要 功能 。 是 时 候 运 
用 你 所 学 的 知识 来 编写 一 个 实际 的 示例 程序 了 。 

贡 穿 全 书 ， 你 将 编写 一 个 CD 数据 库 应 用 程序 ， 从 而 更 好 地 掌握 所 
学 的 知识 。 首 先 从 shell 脚 本 开始 ， 但 很 快 你 就 会 用 C 语 言 重 写 该 程序 ， 
并 给 它 加 上 数据 库 等 新 功能 。 


2.8.1 需求 


假设 你 收集 了 大 量 的 CD 唱片 ， 现 在 为 了 方便 管理 ， 你 将 设计 和 实 
现 一 个 管理 CD 唱片 的 程序 。 在 学 习 Linux 程 序 设计 的 过 程 中 ， 实 现 这 样 
一 个 电子 CD 唱片 目录 看 起 来 是 一 个 比较 理想 的 项 目 。 

开始 阶段 ， 你 至 少 应 该 能 够 做 到 把 每 张 CD 唱片 的 基本 资料 保存 起 
来 ， 如 唱片 的 名 称 、 音 乐 类 型 、 艺 术 家 或 作曲 家 的 名 字 等 。 你 可 能 还 想 
再 保存 一 些 简 单 的 曲目 信息 。 你 希望 能 够 以 每 张 CD 唱片 为 单位 进行 搜 
索 ， 而 不 是 以 曲目 资料 为 单位 。 为 了 让 这 个 小 小 的 应 用 程序 比较 完整 ， 
你 还 希望 能 够 在 这 个 应 用 程序 中 对 唱片 资料 进行 输入 、 更 新 和 删除 。 


2.8.2 ”设计 


3 项 需求 《对 数据 进行 更 新 、 检 索 和 显示 ) 应 该 采用 一 个 简单 的 荣 
单 就 足够 了 。 由 于 所 有 需要 存储 的 数据 全 部 都 是 文本 ， 而 且 假设 你 收集 
的 CD 唱片 不 是 很 多 ， 因 此 你 就 没有 必要 使 用 一 个 复杂 的 数据 库 ， 使 用 
一 些 简单 的 文本 文件 即 可 。 将 资料 保存 在 文本 文件 中 将 使 应 用 程序 比 轻 
简单 ， 而 且 如 果 你 的 需求 发 生 了 变化 ， 操 纵 文 本 文件 总 是 要 比 操纵 其 他 
类 型 的 文件 更 加 容易 。 在 万 不 得 已 的 情况 下 ， 你 其 至 还 可 以 使 用 一 个 编 
辑 需 来 手工 输入 和 删除 数据 ， 而 不 必 非 要 通过 编写 程序 来 完成 。 

你 需要 为 数据 存储 作出 一 个 重要 的 设计 决策 : 一 个 文件 够 用 吗 ? 如 
果 够 用 ， 它 应 该 采用 什么 样 的 格式 ? 除 曲目 信息 以 外 ， 你 想 要 保存 的 大 
部 分 资料 在 每 张 CD 唱片 上 只 出 现 一 次 《我 们 暂 不 考虑 茶 些 CD 唱片 包 合 
人 


”你 需要 对 可 以 存储 在 CD 唱片 上 的 曲目 数量 加 一 个 限制 吗 ? 这 看 起 
来 是 一 个 非常 随意 和 没有 必要 的 限制 ， 所 以 还 是 立刻 放弃 这 个 想法 吧 ! 
如 果 对 曲目 数量 没有 限制 ， 你 就 有 以 下 3 种 选择 。 


O “只 使 用 一 个 文件 ， 用 一 行 来 保存 “标题 ”信息 ， 再 用 《 行 保 存 该 

CD 唱片 上 的 曲目 信息 。 

O 将 每 张 CD 唱 片 的 所 有 信息 都 放置 在 一 行 上 ， 人 允许 该 行 一 直 延 续 

直到 没有 曲目 信息 需要 保存 为 止 。 

口 把 标题 信息 和 曲目 信息 分 开 ， 用 不 同 的 文件 来 分 别 保存 它们 。 

只 有 第 三 种 做 法 能 够 让 你 灵活 地 修改 文件 的 格式 ， 如 果 今 后 你 想 把 
数据 库 转 换 为 关系 数据 库 格 式 的 话 〈 将 在 第 7 章 详 细 介 绍 ) > MR a 
修改 文件 格式 ， 因 此 我 们 选择 第 三 种 方法 。 

下 一 个 决策 是 要 在 文件 里 放 入 哪些 信息 。 

我 们 决定 对 每 张 CD 唱 片 保存 以 下 信息 : 

O CD 唱片 的 目录 编号; 

O 标题 ; 

Oo HRA ZS CAR. WR, iT. BES ; 

O 作曲 家 或 艺术 家 。 

对 曲目 ， 我 们 只 保存 两 条 信息 : 

O 曲目 编号 ; 

oO 曲名 。 

为 了 把 这 两 个 文件 结合 起 来 ， 你 必须 把 曲目 信息 和 CD 唱片 上 的 其 
他 信息 关联 起 来 。 为 此 ， 你 需要 使 用 CD 唱片 的 目录 编写 。 因 为 它 对 每 
张 CD 唱 片 都 是 唯一 的 ， 所 以 它 在 标题 文件 中 只 出 现 一 次 ， 在 曲目 文件 
中 对 每 首 曲 目 也 只 出 现 一 次 。 

让 我 们 来 看 一 个 示例 标题 文件 ， 如 表 2-24 所 示 。 


表 2-24 
目录 编号 is 是 RARE FAR 
CD123 Ñi i 

Classic violin iin Bach 
Hits‘ f: 


它 所 对 应 的 曲目 文件 ， 如 表 2-25 所 示 。 
表 2-25 


目录 编号 TEE a 2 
| 


CD123 2 More jx 
CD234 | Sonata in D minor 
CD345 Dizzy 


这 两 个 文件 通过 目录 编写 结合 在 一 起 。 请 记 住 ， 标 题 文 件 中 的 一 个 
数据 项 一 般 部 对 应 曲目 文件 中 的 多 行 数 据 。 


你 需要 决定 的 最 后 一 件 事情 是 如 何 分 隔 数 据 项 。 在 关系 数据 库 里 ， 
长 度 固定 的 数据 字段 比较 常见 ， 但 它 并 非 总 是 最 方便 的 。 另 一 种 常见 方 
法 是 使 用 逗号 ， 这 个 例子 就 选择 了 这 个 方法 ( 即 用 逗号 分 隔 变 量 ,， 或 
CSV 文 件 ) . 

在 接 下 来 的 “实验 ”部 分 ， 为 了 不 至 于 让 你 迷失 方向 ， 我 们 把 将 要 用 
到 的 函数 列 在 下 面 : 


set_menu_choice(} 


find_cd 


K 验 CD 唱片 应 用 程序 
C1) 和 以 前 一 样 ， 这 个 示例 脚本 程序 的 第 一 行 用 于 确保 目 己 可 以 
作为 一 个 shell 脚 本 程序 来 执行 ， 接 下 来 是 一 些 版 权 信息 : 


ery =pl 
“opYy yht 
i ogre 
ftw 
) any 
his gri t ir 
ITH ANY se d 
MERCHANTABI FOR 
Publ ails 
You should have received a copy of the GNU General Public Licen 1 
¢ with this program; if not, write to the Free Software Foundat 1, In 


(2) 首先 要 做 的 事情 束 是 ， 确 保 设 置 好 脚本 程序 将 要 用 到 的 一 些 
全 局 变量 ， 包 括 标题 文件 、 曲 目 文件 和 一 个 临时 文件 。 我 们 还 设置 
R 的 中 断 处 理 ， 以 确保 在 用 户 中 新 脚本 程序 时 删除 临时 文 


current_cd=** 
temp_files/tmp/cdb.$$ 


(3) 现在 开始 定义 函数 。 因 为 脚本 程序 是 从 文件 的 第 一 行 开 始 执 
行 ， 所 以 这 样 做 可 以 确保 在 调用 任何 一 个 函数 之 前 都 能 够 找到 它 的 定 


义 。 为 了 避免 在 几 个 地 方 反复 编写 同样 的 代码 ， 最 开始 的 两 个 函数 是 简 
单 的 工具 型 函数 : 


etur 


done 


(4) Pe Poke ESE pK AMset_menu_choice. 32 AA AeA 
化 的 ， 当 用 户 选 择 了 某 张 CD 唱片 后 ， 主 沫 单 中 会 多 出 几 个 选项 。 


注意 ，echo-e 命 令 可 能 不 能 被 移植 到 某 些 shel 中 。 


(5) 接 下 来 是 两 个 很 短小 的 函数 insert_title 和 insert track， 它 们 用 
于 回 数 据 库 文件 里 添加 数据 。 虽 然 有 的 人 不 喜欢 这 种 长 度 只 有 一 行 的 函 
数 ， 但 它们 有 助 于 让 其 他 函数 的 含义 更 清晰 易 解 。 
紧 跟 着 这 两 个 函数 的 是 一 个 比较 大 的 函数 add_record_tracks， 它 会 
用 到 上 述 两 个 短小 的 函数 。 这 个 函数 使 用 模式 匹配 来 确保 用 户 未 输入 逐 
号 《因为 我 们 把 逗号 用 做 数据 字段 之 间 的 分 隔 符 ) ， 使 用 算术 操作 在 用 
户 输入 曲目 时 递增 当前 曲目 的 编号 : 


insert_title() { 
echo $* >> $title_file 
return 

} 


insert tracki) { 
echo $* >> $tracks_file 
return 

} 


add_record_tracks({) { 
echo “Enter track information for this CD" 
echo “When no more tracks enter q* 


edtrackel 

cdttitles** 

while { "$cdttitle" != "q" } 

do 
echo -e "Track $cdtrack, track title? \c* 
read tap 
cdttitles$(tmptt,*) 


if [ "$tmp" t= “$cdttitle* Jj; then 
echo "Sorry, no commas allowed" 


continue 

fi 

if { -n “Scdttitle* ] ; then 
if { *Sedttitle" != *g* J; then 

insert_track $cdcatnum, $cdtrack,$cdttitle 

fi 

else 
edtracke$ ((cdtrack-1)} 

fi 

cedtracke$ ((cdtrack+1)) 
done 


) 
(6) add_records 函 数 用 于 输入 新 CD 唱片 的 标题 信息 : 


(7) ”find_cd 函 数 的 作用 是 使 用 grep 命 令 在 CD 唱片 标题 文件 中 查找 

CD 唱片 的 有 关 资 料 。 你 需要 知道 查询 字符 串 在 标题 文件 里 出 现 的 次 
数 ， 但 grep 命 令 的 返回 值 只 能 告诉 你 该 字符 串 是 匹配 了 0 次 还 是 多 次 。 
为 了 解决 这 一 问题 ， 我 们 把 grep 命 令 的 输出 保存 到 一 个 临时 文件 中 ， 文 
件 中 的 每 行 对 应 一 次 匹配 ， 然 后 再 统计 该 文件 的 行 数 。 

单词 统计 命令 wc 在 其 输出 中 使 用 空格 符 分隔 被 统计 文件 中 的 行 数 、 
单词 数 和 字符 个 数 。 我 们 使 用 $ (wc-1 = $temp_file) 标记 从 wc 命 令 的 输 
出 结果 中 提取 出 第 一 个 参数 ， 并 赋值 给 变量 linesfound。 如 果 要 用 到 wc 
命令 输出 中 的 其 他 参数 ， 你 可 以 利用 set 命 令 把 shell 参 数 变量 设置 为 wc 命 
令 的 输出 结果 。 

我 们 把 IFS《〈 内 部 数据 字段 分 隔 符 ) 设置 为 一 个 逗号 ， 这 样 你 束 可 
以 读 取 以 喜 号 分 隔 的 数据 字段 了 。 另 一 个 可 选择 的 命令 是 cut。 


(8) update_cd 函 数 用 于 重新 输入 CD 唱 上 的 资料 。 注 意 ， 你 想 要 
搜索 (使 用 grep〉 的 行 是 以 $cdcatnum 开 头 〈 通 过 标志 ^) 并 且 其 后 跟着 
一 个 加 号 ， 因 此 你 需要 把 车 cdcatnum 变 量 的 扩展 放 在 一 对 花 括 号 {} 里 ， 
这 样 你 就 可 以 搜索 紧 跟 在 CD 目录 编写 之 后 的 吾 写 了 。 这 个 函数 还 在 
get_confirm 返 回 true 的 情况 下 ， 用 花 括 号 将 要 执行 的 多 个 语句 组 成 一 个 


语句 块 。 


(9) ”count_cds 函 数 用 于 快速 统计 数据 库 中 CD 唱片 个 数 和 曲目 总 


remove_records PK 2 H 于 从 数据 库 文件 中 删除 数据 项 ， 它 通 


(103: 
注意 ， 你 必须 使 用 一 个 临时 文件 


过 grep -V 命 = 令 删除 所 有 匹配 的 字符 串 。 


来 完成 这 一 
Bai a 下 面 这 样 的 人 命令 : 


siie file 文 件 就 会 在 grep 合 令 开 始 执 行 之 前 ， 说 > 输出 重 定 癌 操作 设置 
Axe Sue At Digrep er SEA “TS 文件 里 读 取 数 据 。 


(11) list_tracks 函 数 还 是 使 用 grep 命 令 来 找 出 你 想 要 的 行 ， 它 通过 
cut 命 令 来 访问 你 想 要 的 字段 ， 然 后 通过 more 命 令 提 供 按 页 输出 。 如 果 
你 对 比 一 下 用 C 语 言 重 新 实现 这 段 大 约 20 行 左右 的 代码 需要 多 少 条 语句 
的 话 ， 你 惑 不 得 不 佩服 shel 是 一 个 功能 多 么 强大 的 工具 了 。 


Gee 现在 所 有 的 函数 都 已 定义 好 了 ， 你 可 以 进入 主 程序 部 分 
了 。 开 头 的 几 行 先 确 保 需 要 的 文件 处 于 一 个 已 知 状态 ， 然 后 调用 主 菜单 
函数 set_menu_choice， 再 根据 它 的 输出 进行 相应 的 操作 。 

如 果 用 户 选 择 了 退出 ， 程 序 就 先 删 除 临时 文件 ， 再 显示 结束 信息 ， 
最 后 成 功 退 出 (退出 码 为 0) : 


2.8.3 ”应 用 程序 的 说 


脚本 程序 开始 处 的 trap 命 令 用 于 设置 在 用 户 按 下 Ctrl+C 组 合 键 时 的 
中 断 处 理 。 根 据 终端 设置 的 不 同 ，Ctrl+C 组 合 键 可 能 引发 EXIT 或 INT 信 


“Fo 

实现 菜单 选择 还 有 其 他 的 办 法 ， 特 别 值得 一 提 的 是 bash 或 ksh 提 供 
的 select 结 构 ( 但 它 未 被 列 在 X/Open 规范 中 ) 。 它 是 一 个 专门 用 来 处 理 
沫 单 选 择 的 结构 。 如 果 你 并 不 介意 脚本 程序 移植 性 稍 差 的 话 ， 可 以 考虑 
使 用 它 。 你 还 可 以 利用 here 文 档 来 实现 为 用 户 提 供 多 行 信息 。 

你 可 能 已 注意 到 ， 当 添加 一 个 新 的 CD 唱片 记录 时 ， 程 序 并 没有 检 
查 其 主键 。 新 代码 只 是 忽略 使 用 同样 主键 的 后 续 唱 片 标 题 ， 但 把 它们 的 
曲目 添加 到 第 一 个 使 用 该 主键 的 CD 唱片 的 曲目 清单 中 。 如 下 所 示 : 

1 First CD Track 1 

2 First CD Track 2 


1 Another CD 

2 With the same CD key 

我 们 将 把 这 个 问题 及 其 他 改进 留 给 读者 ， 请 充分 发 挥 你 们 的 想象 力 
和 创造 力 ， 因 为 你 可 以 在 GPL 条 款 之 下 任意 修改 这 些 代 码 。 


2.9 ”小 结 


在 本 章 中 ， 你 已 看 到 Shell 本 身 就 是 一 种 功能 强大 的 程序 设计 语言 。 
它 能 够 轻松 调用 其 他 程序 并 对 它们 的 输出 进行 处 理 ， 这 种 能 力 使 得 shell 
成 为 完成 文本 和 文件 处 理 任 务 的 一 个 理想 工具 。 

当 你 下 一 次 需要 一 个 小 工具 程序 时 ， 请 考虑 一 下 你 是 否 可 以 通过 将 
一 些 Linux 命 令 组 合 进 一 个 shell 脚 本 程序 来 解决 自己 的 问题 。 你 会 惊讶 
en eee ee eee 
EJF o 


在 未 章 中 ， 你 将 了 解 Linux 中 的 文件 、 目 录 以 及 相关 操作 。 你 将 
学 习 如 何 创建 、 打 开 、 读 写 和 关闭 文件 ， 还 将 学 习 程序 是 如 何 处 理 目 录 
的 《例如 创建 、 扫 描 和 删除 目录 ) 。 在 上 一 章 我 们 讨论 了 shell 之 后 ， 现 
在 ， 你 将 开始 用 C 语 言 进行 编程 了 。 

在 开始 讨论 Linux 对 文件 VO 的 处 理 方法 之 前 ， 我 们 先 回 顾 一 下 与 文 
件 、 目 录 和 设备 相关 的 概念 。 为 了 对 文件 和 目录 进行 处 理 ， 你 需要 用 到 
系统 调用 (这 是 UNIX 和 Linux 中 与 Windows _ API 对 应 的 概念 ) ， 但 系统 
中 同时 还 存在 一 整套 库 函 数 一 一 标准 WO 库 (stdio) ， 可 以 更 有 效 地 进 
行文 件 处 理 。 

在 本 章 的 大 部 分 内 容 中 ， 我 们 将 详细 讨论 处 理 文件 和 目录 的 各 种 调 
用 。 因 此 ， 本 章 将 涵盖 如 下 各 种 与 文件 相关 的 主题 : 
文件 和 设备 
系统 调用 
库 函 数 
底层 文件 访问 
管理 文件 
标准 IO 库 
格式 化 输入 和 输出 
文件 和 目录 的 维护 
扫描 目录 
错误 及 其 处 理 
/proc 文 件 系统 
高 级 主题 : fcnt1 和 mmap 


口 口 口 口 口 口 口 口 口 口上 口 口 


3.1 Linux yzi 


你 可 能 会 问 ; “为 什么 要 在 这 里 讨论 文件 结构 呢 ? 我 早 知道 它 
了 。” 这 么 说 吧 ， 与 UNIX 一 样 ，Linux 环 境 中 的 文件 具有 特别 重要 的 意 
义 ， 因 为 它们 为 操作 系统 服务 和 设备 提供 了 一 个 简单 而 一 致 的 接口 。 在 
Linux 中 ， 一 切 《 或 几乎 一 切 ) 都 是 文件 。 

这 就 意味 着 ， 通 常 程序 完全 可 以 像 使 用 文件 那样 使 用 磁盘 文件 、 串 
行 口 、 打 印 机 和 其 他 设备 。 在 本 书后 面 的 内 容 中 ， 我 们 将 介绍 一 些 例外 
情况 ， 比 如 第 15 章 中 的 网 络 连接 。 但 大 多 数 情况 下 ， 你 只 需要 使 用 5 个 
基本 的 函数 open、close、read、write 和 ioctl。 

目录 也 是 文件 ， 但 它 是 一 种 特殊 类 型 的 文件 。 在 现代 的 UNIX( 包 
括 Linux) 版 本 中 ， 即 使 是 超级 用 户 可 能 也 不 再 被 允许 直接 对 目录 进行 
写 操 作 了 。 上 所 有 用 户 通常 都 使 用 上 层 的 opendirreaddir 接 口 来 读 取 目录 ， 
而 无 需 了 解 特定 系统 中 目录 实现 的 具体 细节 。 我 们 将 在 本 章 的 后 面 介 绍 
专门 的 目录 函数 。 

可 以 这 么 说 ，Linux 中 的 任何 事物 都 可 以 用 一 个 文件 来 表示 ， 或 者 
通过 特殊 的 文件 提供 。 虽 然 它 们 会 与 你 熟悉 的 传统 文件 有 一 些 细微 的 区 
别 ， 但 两 者 的 基本 原理 是 一 致 的 。 下 面 就 让 我 们 来 看 看 到 目前 为 止 我们 
提 到 的 一 些 特殊 文件 。 


3.1.1 HX 


文件 ， 除 了 本 里 包含 的 内 容 以 外 ， 它 还 会 有 一 个 名 字 和 一 些 属 性 ， 
即 “管理 信息 ”包括 文件 的 创建 /修改 日 期 和 它 的 访问 权限 。 这 些 属性 被 
保存 在 文件 的 inode( 市 点 ) 中 ， 它 是 文件 系统 中 的 一 个 特殊 的 数据 
块 ， 它 同时 还 包含 文件 的 长 度 和 文件 在 磁盘 上 的 存放 位 置 。 系 统 使 用 的 
是 文件 的 inode 编 号 ， 目 录 结 构 为 文件 命名 仪 仅 是 为 了 便于 人 们 使 用 。 

目录 是 用 于 保存 其 他 文件 的 节点 号 和 名 字 的 文件 。 目 录 文 件 中 的 每 
个 数据 项 都 是 指 网 茶 个 文件 节点 的 链接 ， 删 除 文件 名 就 等 于 删除 与 之 对 
应 的 链接 (文件 的 节点 号 可 以 通过 In-i 命 令 查 看 ) 。 你 可 以 通过 使 用 In 命 
令 在 不 同 的 目录 中 创建 指向 同一 个 文件 的 链接 。 

删除 一 个 文件 时 ， 实 质 上 是 删除 了 该 文件 对 应 的 目录 项 ， 同 时 指向 
该 文件 的 链接 数 减 1。 该 文件 中 的 数据 可 能 仍然 能 够 通过 其 他 指向 同一 
文件 的 链接 访问 到 。 如 果 指 问 系 个 文件 的 链接 数 〈 即 ls -1 命令 的 输出 中 
跟 在 访问 权限 后 面 的 那个 数字 〉 变 为 零 ， 束 表示 该 节点 以 及 其 指 癌 的 数 
据 不 再 被 使 用 ， 人 磁盘 上 的 相应 位 置 束 会 被 标记 为 可 用 空间 。 


文件 被 安排 在 目录 中 ， 目 录 中 可 能 还 包含 子 目 录 。 这 些 构 成 了 我 们 
所 熟悉 的 文件 系统 层次 结构 。 用 户 〈 比 如 neil) 通常 会 将 自己 的 文件 保 
存在 家 目录 中 ， 这 可 能 是 目录 /home/neil， 该 目录 还 将 包含 用 于 保存 电 
子 邮 件 、 丙 业 信 函 、 工 具 程 序 等 的 子 目 录 。 注 意 ， 许 多 UNIX 和 Linux 的 
shell 都 允许 用 户 通 过 波浪 线 符号 (~) 直接 进入 自己 的 家 目录 。 要 想 进 
入 他 人 的 家 目录 ， 就 键入 ~user (~ 加 用 户 名 〉 即 可 。 如 你 所 知 ， 每 个 用 
户 的 家 目录 通常 是 一 个 上 层 目 录 的 子 目 录 ， 这 个 上 层 目 录 是 专 为 此 目的 


TERS, ERE Pa itl Ee R SAS Be BE HE SCF a BBP Hh shells 
pore 所 以 你 必须 始终 在 自己 的 程序 中 使 用 真实 的 文件 


/home 目录 本 喘 又 是 根 目 录 / 的 一 个 子 目 录 ， 根 目录 位 于 目录 层次 的 
最 顶端 ， 它 在 它 的 各 级 子 目 录 中 包含 着 系统 中 的 所 有 文件 。 根 目录 中 通 
贡 包 含 用 于 存放 系统 程序 〈 二 进 制 可 执行 文件 ) 的 /bin 子 目录 、 用 于 存 
放 系 统 配置 文件 的 /etc 子 目录 和 用 于 存放 系统 函数 库 的 /tib 子 目录 。 代 表 
物理 设备 并 为 这 些 设备 提供 接口 的 文件 按照 惯例 会 被 放 在 /dev 子 目录 
中 。 图 3-1 显 示 了 一 个 典型 的 Linux 目 录 结 构 的 一 部 分 。 关 于 Linux 文 件 系 
统 布局 的 更 多 信息 请 见 第 18 章 中 有 关 Linux 文 件 系 统 标准 的 讨论 。 


ee 


bin dev home 


neil rick 


pe 


mail letters programs 


3.1.2 a Hiz 


甚至 硬件 设备 在 Linux 中 通常 也 被 表示 CUR 为 文件 。 例 如 ， 作 
ee 


# mount -t iso9660 /dev/hdc /mnt/cdrom 
hi cå /mnt/cdrom 


这 个 命令 将 CD-ROM 设 备 〈 在 本 例 中 ， 是 在 系统 启动 时 被 装载 

为 /devhdc 的 第 二 个 主 IDE 设 备 ， 其 他 类 型 的 设备 对 应 不 同 的 /dev 条 目 ) 
中 的 当前 内 容 挂 载 为 /mnt/cdrom 目 录 下 的 文件 结构 。 然 后 ， 你 就 可 以 像 
往常 一 样 浏览 CD-ROM 的 目录 ， 只 不 过 该 目录 中 的 内 容 是 只 读 的 。 

UNIX 和 Linux 中 比较 重要 的 设备 文件 有 3 个 : /dev/console, /dev/tty 
和 /dev/null。 

1. /dev/console 

这 个 设备 代表 的 是 系统 控制 台 。 错 误 信 息 和 诊断 信息 通常 会 被 发 送 
到 这 个 设备 。 每 个 UNIX 系 统 都 会 有 一 个 指定 的 终端 或 显示 屏 用 来 接收 
控制 台 消 息 。 过 去 ， 它 可 能 是 一 台 专 用 的 打印 终端 。 在 现代 的 工作 站 和 
Linux 上， 它 通常 是 “活跃 ”的 虚拟 控制 台 ; 而 在 X 视 窗 系 统 中 ， 它 会 是 屏 
幕 上 一 个 特殊 的 控制 台 窗 口 。 

2./dev/tty 

如 果 一 个 进程 有 控制 终端 的 话 ， 那 么 特殊 文件 /dev/tty 就 是 这 个 控制 
终端 〈 键 盘 和 显示 屏 ， 或 键盘 和 窗口 ) 的 别名 〈 逻 辑 设备 ) 。 例 如 ， 由 
系统 自动 运行 的 进程 和 脚本 就 没有 控制 终端 ， 所 以 它们 不 能 打 
开 /dev/tty。 

在 能 够 使 用 该 设备 文件 的 情况 下 ，/dev/tty 允 许 程序 直接 同 用 户 输出 
信息 ， 而 不 管用 户 具 体 使 用 的 是 哪 种 类 型 的 伪 终 端 或 硬件 终端 。 在 标准 
输出 被 重 定 同 时 ， 这 一 功能 非常 有 用 。 使 用 命令 ls -R Imore 显 示 一 个 长 
目录 列表 就 是 一 个 这 样 的 例子 ，more 程 序 需 要 提示 用 户 进行 键盘 操作 之 
后 才能 显示 下 一 页 内 容 。 你 将 在 第 5 章 中 看 到 更 多 使 用 /dewtty 的 例子 。 

注意 ， 虽 然 /devwconsole 设 备 只 有 一 个 ， 但 通过 /dewtty 却 能 够 访问 许 
多 不 同 的 物理 设备 。 

3./dev/null 

/dev/null Off 7222 (null) 设备 。 所 有 写 癌 这 个 设备 的 输出 都 将 被 于 
弃 ， 而 读 这 个 设备 会 立刻 返回 一 个 文件 尾 标志 ， 所 以 在 cp 命令 里 可 以 把 
它 用 做 复制 空 文件 的 源 文件 。 人 们 常 把 不 需要 的 输出 重 定 问 
到 /devnull。 


创建 空 文件 的 另 一 个 方法 是 使 用 touch <filename> 命 令 ， 该 命令 
的 作用 是 改变 文件 的 修改 时 间 。 如 果 指 定 的 文件 不 存在 ， 就 创建 
它 ， 但 该 命令 并 不 会 把 有 内 容 的 文件 变 成 空 文件 。 


S echo do not want to see this >/dev/null 
$ cp /dev/null empty _ file 


/dev 目 录 中 的 其 他 设备 包括 : TEER. ain. eT Ky 
器 、CD-ROM、 声 卡 以 及 一 些 代 表 系 统 内 部 工作 状态 的 设备 。 该 目录 中 
甚至 还 有 /dewzero 设 备 ， 它 可 以 作为 创建 空 文件 的 null 字 节 源 。 访 问 访 
目录 中 的 某 些 设备 需要 具有 超级 用 户 权 限 ， 普 通用 户 不 能 通过 编写 程序 
来 直接 访问 如 硬盘 这 样 的 底层 设备 。 设 备 文件 的 名 字 会 随 系 统 的 不 同 而 
不 同 。Linux 发 行 版 通常 都 提供 了 以 超级 用 户 喘 份 运行 的 应 用 程序 ， 用 
来 管理 那些 以 其 他 用 户 丹 份 无 法 访问 的 设备 ， 例 如 ， 用 于 挂 载 文件 系统 
的 mount 命 令 。 

设备 被 分 为 字符 设备 和 块 设 备 。 两 者 区 别 在 于 访问 设备 时 是 否 需要 
一 次 读 写 一 整 块 。 一 般 情况 下 ， 块 设备 是 那些 文 持 某 些 类 型 文件 系统 的 
设备 ， 例 如 硬盘 。 

在 本 章 中 ， 我 们 将 集中 讨论 磁盘 文件 和 目录 。 我 们 将 在 第 5 章 中 讨 
论 另 一 种 设备 一 一 用 户 终 端 。 


你 只 需 用 很 少量 的 函数 就 可 以 对 文件 和 设备 进行 访问 和 控制 。 这 些 
函数 被 称 为 系统 调用 ， 由 UNIX (和 Linux) 直接 提供 ， 它 们 也 是 通 向 操 
作 系 统 本 里 的 接口 。 

操作 系统 的 核心 部 分 ， 即 内 核 ， 是 一 组 设备 驱动 程序 。 它 们 是 一 组 
对 系统 硬件 进行 控制 的 底层 接口 。 例 如 ， 磁 带 机 就 有 一 个 与 之 对 应 的 设 
备 驱 动 程序 ， 它 知道 如 何 启 动 磁带 、 如 何 对 它 前 后 回 绕 、 如 何 对 它 进行 
读 写 等 。 它 还 知道 磁带 必须 以 固定 长 度 的 数据 块 为 单位 进行 读 写 。 因 为 
破 带 在 实质 上 是 一 个 顺序 存 取 设备 ， 所 以 驱动 程序 并 不 能 直接 访问 磁带 
上 的 数据 块 。 而 是 必须 先 把 它 回 经 到 正确 的 位 置 。 

5 了 向 用 户 提供 一 个 一 致 的 接口 ， 设 备 驱动 程序 封装 了 所 有 与 硬件 
T ro 硬件 的 特有 功能 通常 可 通过 ioctl 〈 用 于 IO 控制 ) 系统 调用 
是 供 

/dev 目 录 中 的 设备 文件 的 用 法 都 是 相同 的 ， 它 们 都 可 以 被 打开 、 
读 、 写 和 关闭 。 例 如 ， 用 来 访问 普通 文件 的 open 调 用 同样 可 以 用 来 访问 
用 户 终端 、 打 印 机 或 磁带 机 。 

下 面 是 用 于 访问 设备 驱动 程序 的 底层 函数 〈 系 统 调 用 ) 。 
open: 打开 文件 或 设备 。 
read: 从 打开 的 文件 或 设备 里 读数 据 。 
write: 问 文 件 或 设备 写 数据 。 
close: 关闭 文件 或 设备 。 
ioctl: 把 控制 信息 传递 给 设备 驱动 程序 。 

系统 调用 iocU 用 于 提供 一 些 t 与 特定 硬件 设备 有 关 的 必要 控制 (与 正 
常 的 输入 输出 相反 ) ， 所 以 它 的 用 法 随 设备 的 不 同 而 不 同 。 例 如 ，ioctl 
调用 可 以 用 于 回 绕 磁带 机 或 设置 串 行 口 的 流 控 特性 。 因 此 ，ioctl 并 不 需 
要 具备 可 移植 性 。 此 外 ， 每 个 驱动 程序 都 定义 了 它 自 己 的 一 组 ioctl 命 


令 。 

这 些 系统 调用 和 其 他 系统 调用 的 文档 一 般 放 在 手册 页 的 第 二 节 。 提 
供 系统 调用 参数 列表 和 返回 类 型 的 函数 原型 及 相关 的 #define 常 量 都 由 
include 文 件 提供 。 每 个 系统 调用 独 有 的 要 求 可 参见 各 个 系统 调用 的 说 
H. 


OOOOd 


3.3 pK% 


针对 输入 输出 操作 直接 使 用 底层 系统 调用 的 一 个 问题 是 它们 的 效率 
非常 低 。 为 什么 呢 ? 

口 使 用 系统 调用 会 影响 系统 的 性 能 。 与 函数 调用 相 比 ， 系 统 调用 

的 开销 要 大 些 ， 因 为 在 执行 系统 调用 时 ，Linux 必 须 从 运行 用 户 代 

人 码 切 换 到 执行 内 核 代 码 ， 然 后 再 返回 用 户 代 码 。 减 少 这 种 开销 的 一 

个 好 方法 是 ， 在 程序 中 尽量 减少 系统 调用 的 次 数 ， 并 且 让 每 次 系统 

调用 完成 尽 可 能 多 的 工作 。 例 如 ， 每 次 读 写 大 量 的 数据 而 不 是 每 次 

仅 读 写 一 个 字符 。 

O 硬件 会 限制 对 底层 系统 调用 一 次 所 能 读 写 的 数据 块 大 小 。 例 

如 ， 人 磁带 机 通常 一 次 能 写 的 数据 块 长 度 是 10k。 所 以 ， 如 果 你 试图 

写 的 数据 量 不 是 10k 的 整数 倍 ， 磁 带 机 还 是 会 以 10k 为 单位 卷 绕 磁 

带 ， 从 而 在 磁带 上 留 下 了 空 际 。 

为 了 给 设备 和 破 盘 文件 提供 更 高 层 的 接口 ，Linux 发 行 版 和 
UNIX) 提供 了 一 系列 的 标准 函数 库 。 它 们 是 一 些 由 函数 构成 的 集合 ， 
你 可 以 把 它们 应 用 到 自己 的 程序 中 ， 比 如 提供 输出 缓冲 功能 的 标准 IO 
库 。 你 可 以 高 效 地 写 任意 长 度 的 数据 块 ， 库 函数 则 在 数据 满足 数据 块 长 
度 要 求 时 安排 执行 底层 系统 调用 。 这 就 极 大 降低 了 系统 调用 的 开销 。 

库 函 数 的 文档 一 般 被 放 在 手册 页 的 第 三 节 ， 并 且 库 函数 往往 会 有 一 
个 与 之 对 应 的 标准 头 文 件 ， 例 如 与 标准 MO 库 对 应 的 头 文件 是 stdio.h。 

图 3-2 是 对 前 面 几 小 节 讨 论 的 总 结 ， 它 显示 了 Linux 系 统 中 各 种 文件 
函数 与 用 户 、 设 备 驱 动 程序 、 内 核 和 硬件 之 间 的 关系 。 


3.4 = CPE Ia 


每 个 运行 中 的 程序 被 称 为 进程 (process) ， 它 有 一 些 与 之 关联 的 文 
件 描述 符 。 这 是 一 些小 值 整 数 ， 你 可 以 通过 它们 访问 打开 的 文件 或 设 
备 。 有 多 少 文 件 描述 符 可 用 取决 于 系统 的 配置 情况 。 当 一 个 程序 开始 运 
行 时 ， 它 一 般 会 有 3 个 已 经 打开 的 文件 描述 符 : 

O 0: 标准 输入 

O 1: 标准 输出 

口 2: 标准 错误 

你 可 以 通过 系统 调用 open 把 其 他 文件 描述 符 与 文件 和 设备 相关 联 ， 
稍 后 讲解 。 其 实 使 用 上 自动 打开 的 文件 描述 符 惑 已 经 可 以 通过 write 系统 调 
用 来 创建 一 些 简单 的 程序 了 。 


3.4.1 write 系统 调用 


系统 调用 write 的 作用 是 把 缓冲 区 buf 的 前 nbytes 个 字 节 写 入 与 文件 摘 
述 符 fildes 关 联 的 文件 中 。 它 返回 实际 写 入 的 字 节 数 。 如 果 文 件 摘 述 符 
有 错 或 者 底层 的 设备 驱动 程序 对 数据 块 长 度 比 较 敏 感 ， 该 返回 值 可 能 会 
小 于 nbytes。 如 果 这 个 函数 返回 0， 就 表示 未 写 入 任何 数据 ;如 果 它 返回 
的 是 -1， 就 表示 在 write 调用 中 出 现 了 错误 ， 错 误 代 码 保存 在 全 局 变量 
errno 里 。 

下 面 是 write 系 统 调 用 的 原型 : 


#include <unistd.h> 


size_t write(int fildes, const void *buf, size_t nbytes); 


AS ISLA, MAY AS AEF simple_write.c T : 


de <unistd.h> 


include <stdlib.h> 


这 个 程序 只 是 在 标准 输出 上 显示 一 条 消息 。 当 程序 退出 运行 时 ， 所 
有 已 经 打开 的 文件 描述 符 都 会 目 动 关闭 ， 所 以 你 不 需要 明确 地 关闭 它 


们 。 但 处 理 被 缓冲 的 输出 时 ， 情 况 就 不 一 样 了 。 
$ ./simple_write 
Here 1S some data 
9 
需要 再 次 提醒 的 是 ，write 可 能 会 报告 写 入 的 字 节 比 你 要 求 的 少 。 这 


并 不 一 定 是 个 错误 。 在 程序 中 ， 你 需要 检查 ermo 以 发 现 错误 ， 然 后 再 次 
调用 write 写 入 剩余 的 数据 。 


3.4.2 read% 2 i 


系统 调用 read 的 作用 是 : 从 与 文件 描述 符 馈 des 相关 联 的 文件 里 读 入 
nbytes 个 字 节 的 数据 ， 并 把 它们 放 到 数据 区 buf 中 。 它 返回 实际 读 入 的 字 
节 数 ， 这 可 能 会 小 于 请 求 的 字 节 数 。 如 果 read 调 用 返回 0， 就 表示 未 读 
入 任何 数据 ， 已 到 达 了 文件 尾 。 同 样 ， 如 果 返 回 的 是 -1， 就 表示 read 调 
用 出 现 了 错误 。 


#include <unistd.h> 


size_t read(int fildes, void *buf, size t nbytes); 


下 面 这 个 程序 simple_read.c 把 标准 输入 的 前 128 个 字 节 复制 到 标准 输 
出 。 如 果 输 入 少 于 128 个 字 节 ， 就 把 它们 全 体 复 制 过 去 。 


finclude <unistd.h> 
include <stdlib.h> 


int main() 
{ 
char buffer{i28); 


int nread; 


nread = read(0, buffer, 128); 
if (nread == -1) 
write(2, "A read error has occurred\n", 26); 


if ((write(1.buffer,nread)) != nread) 
write(2, "A write error has occurred\n", 27); 


exit(0); 
} 

运行 这 个 程序 ， 你 会 看 到 : 
$ echo hello there | ./simple_read 


$ ./eimple_read < drafti.txt 


; chapter we will be looking at files and directories and how to manipulate 


then. We will learn how to create f 
时 ， 


j 你 使 用 echo 通 过 管道 为 程序 提供 输入 。 在 第 二 


第 一 次 运行 程序 


次 运行 时 ， 你 通过 文件 重 定向 输入 。 此 时 ， 你 可 以 看 到 文件 draftl.txt 的 
第 一 部 分 出 现在 了 标准 输出 上 。 


请 注意 ， 下 一 个 shell 提 示 符 出 现在 输出 数据 最 后 一 行 的 尾部 ， 
因为 在 这 个 例子 中 ，128 个 字 节 的 数据 并 没有 构成 一 个 完整 的 行 。 


为 了 创建 一 个 新 的 文件 描述 符 ， 你 需要 使 用 系统 调用 open。 
#include <fcntl.h> 
#include <sys/types.h> 
#include <sys/stat.h> 


int open(const char *path, int oflags); 
int open(const char *path, int oflags, mode_t mode); 


严格 来 说 ， 在 遵循 POSIX 规 范 的 系统 上 ， 使 用 open 系 统 调用 并 
不 需要 包括 头 文件 sys/types.h 和 sys/stath， 但 在 某 些 UNIX 系 统 上 ， 
它们 可 能 是 必 不 可 少 的 。 


简单 地 说 ，open 建 立 了 一 条 到 文件 或 设备 的 访问 路 径 。 如 果 调 用 成 
Di, 它 将 返回 一 个 可 以 被 read、write 和 其 他 系统 调用 使 用 的 文件 描述 
符 。 这 个 文件 描述 符 是 唯一 的 ， 它 不 会 与 任何 其 他 运行 中 的 进程 共享 。 
如 条 了 两 个 程序 同时 打开 同一 个 文件 ， 它 们 会 分 别 得 到 两 个 不 同 的 文件 插 
述 符 。 如 果 它 们 都 对 文件 进行 写 操作 ， 那么 它们 会 仁 写 千 的 ， 它们 分 别 
接着 上 次 离开 的 位 置 继 续 往 下 写 。 它 们 的 数据 不 会 交织 在 一 起 ， 而 是 - 
Ue EAA o PAS EPCRA Si mE) of 你 可 以 通 
使 用 文件 锁 功 能 来 防止 出 现 冲 突 ， 我 们 将 在 第 7 章 里 介绍 该 功能 。 

准备 打开 的 文件 或 设备 的 名 字 作 为 参数 path 传 递 给 函 数 ，oflags 参 数 
用 于 指定 打开 文件 所 采取 的 动作 。 

oflags 参 数 是 通过 必需 文件 访问 模式 与 其 他 可 选 模式 相 结 合 的 方式 


来 指定 的 。open 调 用 必须 指定 表 3-1 中 所 示 的 文件 访问 模式 之 一 。 
表 3-1 


说 sA 
只 读 方 式 # 


open 调 用 还 eer sien narrates E 《用 “ 按 位 


或 ”操作 ) o 

O O APPEND: 把 写 入 数据 追加 在 文件 的 末尾 。 

O O_TRUNC: 把 文件 长 度 设置 为 零 ， 于 弃 已 有 的 内 容 。 

Oo _ 如 果 需 要 ， 就 按 参 数 mode 中 给 出 的 访问 模式 创建 

文件 。 

O O_EXCL: 与 O_CREAT 一 起 使 用 ， 确 保 调用 者 创建 出 文件 。 

Open 调 用 是 一 个 原子 操作 ， 也 就 是 说 ， 它 只 执行 一 个 图 数 调 用 。 使 

用 这 个 可 选 模式 可 以 防止 两 个 程序 同时 创建 同一 个 文件 。 如 果 文 件 

已 经 存在 ，open 调 用 将 失败 。 

其 他 可 以 使 用 的 oflag 值 请 参考 open 调 用 的 手册 页 ， 它 们 出 现在 该 手 
册页 的 第 二 节 〈 使 用 man 2open 命 令 碍 看 ) 。 

open 调 用 在 成 功 时 返回 一 个 新 的 文件 描述 符 ( 它 总 是 一 个 非 负 整 
数 ) ， 在 失败 时 返回 -1 并 设置 全 局 变量 errno 来 指明 失败 的 原因 。 我 们 将 
在 本 章 后 面 对 errno 做 进一步 讨论 。 新 文件 描述 符 总 是 使 用 未 用 描述 符 的 
最 小 值 ， 这 个 特征 在 某 些 情况 下 非常 有 有用。 例如， 如果 一 个 程序 关闭 了 
它 的 标准 输出 ， 然 后 再 次 调用 open， 文 件 描 述 符 1 就 会 被 重新 使 用 ， 并 
旦 标准 输出 将 被 有 效 地 重 定向 到 男 一 个 文件 或 设备 。 

POSIX 规 范 还 标准 化 了 一 个 creat 调 用 ， 但 它 并 不 常用 。 这 个 调用 不 
仅 会 像 我 们 预期 的 那样 创建 文件 ， 还 会 打开 文件 。 它 的 作用 相当 于 以 
oflags 标 志 O_CREATIO_WRONLYIO_TRUNC 来 调用 open。 

任何 一 个 运行 中 的 程序 能 够 同时 打开 的 文件 数 是 有 限制 的 。 这 个 限 
制 通常 是 由 limits.h 头 文件 中 的 常量 OPEN_MAX 定 义 的 ， 它 的 值 随 系统 
的 不 同 而 不 同 ， 但 POSIX 要 求 它 至 少 为 16。 这 个 限制 本 喘 还 受到 本 地 系 
统 全 局 性 限制 的 影响 ， 所 以 一 个 程序 未 必 总 是 能 够 打开 这 么 多 文件 。 在 
Linux 系 统 中 ， 这 个 限制 可 以 在 系统 运行 时 调整 ， 所 以 OPEN_MAX 并 不 
是 一 个 常量 。 它 通常 一 开始 被 设置 为 256。 


3.4.4 访问 权限 的 初始 什 


当 你 使 用 带 有 O_CREAT 标 志 的 open 调 用 来 创建 文件 时 ， 你 必须 使 
用 有 3 个 参数 格式 的 open 调 用 。 第 三 个 参数 mode 是 几 个 标志 按 位 或 后 得 
到 的 ， 这 些 标志 在 头 文件 sys/stat.h。 中 定义 ， 如 下 所 示 。 

S_IRUSR: 读 权 限 ， 文 件 属 主 。 
S_IWUSR: 写 权限 ， 文 件 属 主 。 
S_IXUSR: 执行 权限 ， 文 件 属 主 。 
S_IRGRP: 读 权 限 ， 文 件 所 属 组 。 
S_IWGRP: 写 权限 ， 文 件 所 属 组 。 


OOOOd 


O S_IXGRP: 执行 权限 ， 文 件 所 属 组 。 
O S_IROTH: 读 权 限 ， 其 他 用 户 。 

O S IWOTH: 写 权限 ， 其 他 用 户 。 

O S_IXOTH: 执行 权限 ， 其 他 用 户 。 
请 看 下 面 的 例子 : 


open ("myfile", O_CREAT, S_IRUSR|S_IXOTH) ; 


它 的 作用 是 创建 一 个 名 为 myfile 的 文件 ， 文 件 属 主 拥有 读 权 限 ， 其 他 用 
户 拥 有 执行 权限 ， 且 只 设置 了 这 些 权限 。 


5 ls -ls se 


只 有 在 他 建文 伯 时 会 人 用 其 次 ， HE a 令 设 

) 会 影响 到 被 创建 文件 的 访问 权限 。open 调 用 里 给 出 的 mode 值 将 与 当 
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001， 并 且 指 定 了 S_IXOTH 模 式 标志 ， 那 么 其 他 用 户 对 创建 的 文件 不 会 
拥有 执行 权限 ， 因 为 用 户 掩 码 中 指定 了 不 允许 回 其 他 用 户 提 供 执行 权 
限 。 因 此 ，open 和 creat 调 用 中 的 标志 实际 上 是 发 出 设置 文件 访问 权限 的 
请 求 ， 所 请 求 的 权限 是 否 会 被 设置 取决 于 当时 umask 的 值 。 

1. umask 

umask 是 一 个 系统 变量 ， 它 的 作用 是 : 当 文 件 被 创建 时 ， 为 文件 的 
访问 权限 设 定 一 个 掩 码 。 执 行 umask 命 令 可 以 修改 这 个 变量 的 值 。 它 是 
一 个 由 3 个 八进制 数字 组 成 的 值 。 每 个 数字 都 是 八进制 值 1、2、4 的 OR 
操作 结果 。 它 们 的 具体 含义 见 表 3-2， 这 3 个 数字 分 别 对 应 着 用 户 
Cuser) ~ 2H (group) 和 其 他 用 户 (other) 的 访问 权限 。 


表 3-2 


a TF wo ff 
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例如 ， 如 果 要 禁止 组 的 写 和 执行 权限 ， 同 时 禁止 其 他 用 户 的 写 权 
限 ， 那 么 umask 值 应 该 如 表 3-3 所 示 。 


表 3-3 


R O F = x 
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每 个 数字 的 取 值 OR 在 一 起 ， 因 此 第 2 个 数字 的 值 是 2 | 1， 结 果 为 3。 
最 终 的 umask 值 为 032。 

当 你 通过 open 或 creat 调 用 创建 文件 时 ，mode 参 数 将 与 当前 的 umask 
值 进 行 比 较 。 在 mode 参 数 中 被 设置 的 位 如 果 在 umask 值 中 也 被 设置 了 ， 
那么 它 就 会 从 文件 的 访问 权限 中 删除 。 因 此 ， 用 户 完 全 可 以 设置 自己 的 
环境 ， 比 如 “不 准 创建 允许 其 他 用 户 有 写 权 限 的 文件 ， 即 使 创建 该 文件 
的 程序 要 求 该 权限 也 不 行 。” 这 样 做 虽然 并 不 能 阻止 程序 或 用 户 在 随后 
使 用 chmod 命 令 ( 或 者 在 程序 中 使 用 chmod 系 统 调用 ) 来 添加 其 他 用 户 
的 写 权 限 ， 但 它 确实 能 够 帮助 用 户 ， 使 他 们 不 必 对 每 个 新 文件 都 去 检查 
和 设置 其 访问 权限 。 

2.close 系 统 调用 

你 可 以 使 用 close 调 用 终止 文件 描述 符 旬 des 与 其 对 应 文件 之 间 的 关 
和 close 调 用 成 功 时 返回 0， 出 错 
时 返回 -1。 


#include <unistd.h> 


int close(int fildes); 


注意 ， 检 查 close 调 用 的 返回 结果 非常 重要 。 有 的 文件 系统 ， 特 


别 是 网 络 文件 系统 ， 可 能 不 会 在 关闭 文件 之 前 报告 文件 写 操作 中 出 
现 的 错误 ， 这 是 因为 在 执行 写 操作 时 ， 数 据 可 能 未 被 确认 写 入 。 


3.ioctl 系 统 调用 

ioctl 调 用 有 点 像 是 个 大 杂烩 。 它 提供 了 一 个 用 于 控制 设备 及 其 摘 述 
符 行 为 和 配置 底层 服务 的 接口 。 终 端 、 文 件 描述 符 、 套 接 字 甚至 磁带 机 
都 可 以 有 为 它们 定义 的 ioctl， 具 体 细 节 可 以 参考 特定 设备 的 手册 页 。 
POSIX 规 范 只 为 流 〈stream) 定义 了 ioctl 调 用 ， 但 它 超 出 了 本 书 讨 论 的 
范围 。 下 面 是 ioctl 的 原型 ; 


#include <unistd.h> 


int ioctl(int fildes, int cmd, ...); 


ioctl 对 描述 符 fildes 引 用 的 对 象 执 行 cmd 参数 中 给 出 的 操作 。 根 据 特 
定 设备 所 支持 操作 的 不 同 ， 它 还 可 能 会 有 一 个 可 选 的 第 三 参数 。 
例如 ， 在 Linux 系 统 上 对 ioct 的 如 下 调用 将 打开 键盘 上 的 LED 灯 : 


ioctl(tty_fd, KDSETLED, LED_NUM|LED_CAP|LED_SCR) ; 


K 验 一 个 文件 复制 程序 

在 学 习 了 关于 open、read 和 write 系统 调用 的 知识 以 后 ， 我 们 来 编写 
人 
Besa 
在 本 章 中 ， 我 们 将 采用 多 种 方法 来 完成 这 一 工作 ， 以 比较 各 种 方法 
的 执行 效率 。 为 简单 起 见 ， 我 们 将 假设 输入 文件 已 经 存在 ， 输 出 文件 不 
和 存在， 并且 所 有 的 读 写 操作 都 成 功 。 当 然 ， 在 实际 程序 里 ， 我 们 必须 检 
验 这 些 假设 是 否 成 立 ! 

(1) 首先 ， 你 需要 有 一 个 用 于 测试 的 输入 文件 ， 长 度 为 1IMB， 取 
名 为 file.in。 

(2) 然后 编译 copy_system.c: 


注意 ，##nclude<unistd.h> 行 必须 首先 出 现 ， 因 为 它 定义 的 与 
POSIX 规 范 有 关 的 标志 可 能 会 影响 到 其 他 的 头 文件 。 


(3) 运行 这 个 程序 ， 将 得 到 如 下 的 输出 结果 : 
5 TIMEFORMAT="" time ./copy_system 
¢.67user 14 57elapse 


6.90system 2:32 d 99%CPU 
$ ls -ls file.in file.out 
1029 -rw-r---r l nei 


实验 解析 

我 们 在 这 里 使 用 time 工 具 对 这 个 程序 的 运行 时 间 进 行 了 测算 。 
Linux 使 用 TIMEFORMAT 变 量 来 重 置 默认 的 POSIX 时 间 输 出 格式 ， 
POSIX 时 间 格 式 不 包括 CPU 使 用 率 。 你 可 以 看 到 在 这 人 台 相 当 老 的 系统 
上 ，1MB 的 输入 文件 fle.in 被 成 功 复制 到 fle.out， 后 者 只 人 允许 属 主 拥有 
读 写 权限 。 但 这 次 复制 花费 了 大 约 两 分 半 钟 ， 并 且 几 乎 消耗 了 所 有 的 
CPU 时 间 。 之 所 以 这 么 慢 ， 是 因为 它 必 须 完 成 超过 两 百 万 次 的 系统 调 
H- 

近 些 年 来 ，Linux 在 系统 调用 和 文件 系统 性 能 方面 有 了 很 大 改善 。 
一 个 类 似 的 测试 在 Linux 2.6 内 核 下 只 需 不 到 14 秒 就 完成 了 。 
$ TIMEFORMAT="" time ./copy_ system 
2.08user 10.59system 0:13.74elapsed 92%CPU 


X 验 另 一 个 文件 复制 程序 

你 可 以 通过 复制 大 一 些 的 数据 块 来 改善 效率 较 低 的 问题 ， 请 看 下 面 
这 个 改进 后 的 程序 copy_block.c， 它 每 次 复制 长 度 为 IK 的 数据 块 ， 用 的 
还 是 系统 调用 : 


int nread 

Su pen(*file.cut* > WRONLY|/O_ CREAT, S_IRUSR|S_IWUSR 

while((nread = read(in,block,sizeof(block}))) > 0) 
writelout, block,nread); 


先 删除 旧 的 输出 文件 ， 然 后 运行 这 个 程序 : 
$ rm file.out 


$ TIMEFORMAT="" time ./copy_ block 
0.00user 0.02system 0:00.04elapsed 78%CPU 


“实验 解析 

改进 后 的 程序 只 花费 了 百 分 之 几 秒 的 时 间 ， 因 为 它 只 需 做 大 约 2000 
次 系统 调用 。 当 然 ， 这 些 时 间 与 系统 本 身 的 性 能 有 很 大 的 关系 ， 但 它们 
确实 显示 了 系统 调用 需要 巨大 的 开支 ， 因 此 值得 对 其 债 用 进行 优化 。 


A 


3.4.5 ”其 他 与 文件 管理 有 关 的 系统 调用 


还 有 许多 其 他 的 系统 调用 能 够 操作 这 些 底层 文件 描述 符 。 通 过 它 
们 ， 程 序 可 以 控制 文件 的 使 用 方式 和 返回 文件 的 状态 信息 。 
1. lseek 系 统 调 用 
lseek 系 统 调用 对 文件 描述 符 fildes 的 读 写 指针 进行 设置 。 也 就 是 
说 ， 你 可 以 用 它 来 设置 文件 的 下 一 个 读 写 位 置 。 读 写 指 针 既 可 被 设置 为 
文件 中 的 某 个 绝对 位 置 ， 也 可 以 把 它 设 置 为 相对 于 当前 位 置 或 文件 尾 的 
某 个 相对 位 置 。 
#include <unistd.h> 
#include <sys/types.h> 


off t lseek(int fildes, off t offset, int whence); 
offset 参 数 用 来 指定 位 置 ， 而 whence 参 数 定义 该 偏 移 值 的 用 法 。 
whence 可 以 取 下 列 值 之 一 。 
O SEEK_SET: offset 是 一 个 绝对 位 置 。 
口 SEEK_CUR: offset 是 相对 于 当前 位 置 的 一 个 相对 位 置 。 


O SEEK_END: offset 是 相对 于 文件 尾 的 一 个 相对 位 置 。 

lseek 返 回 从 文件 头 到 文件 指针 被 设置 处 的 字 节 偏 移 值 ， 失 败 时 返 
回 -1。 参 数 offset 的 类 型 off_t 是 一 个 与 具体 实现 有 关 的 整数 类 型 ， 它 定义 
在 头 文件 sys/types.h 中 。 

2. fstat、stat 和 ]lstat 系 统 调用 
fstat 系 统 调用 返回 与 打开 的 文件 描述 符 相关 的 文件 的 状态 信息 ， 该 
信息 将 会 写 到 一 个 buf 结 构 中 ，buf 的 地 址 以 参数 形式 传递 给 fstat。 

下 面 是 它们 的 原型 : 

#include <unistd.h> 

#include <sys/stat.h> 

#include <sys/types.h> 


int fstat(int fildes, struct stat *buf); 
int stat(const char *path, struct stat *buf); 
int lstat(const char *path, struct stat *buf); 


_ 注意 ;包含 关 文 件 sys/types.h 是 可 选 的 ， 但 由 于 一 些 系统 调用 
的 定义 针对 那些 某 天 可 能 会 做 出 调整 的 标准 类 型 使 用 了 别名 ， 所 以 
0 


相关 函数 stat 和 1lstat 返 回 的 是 通过 文件 名 查 到 的 状态 信息 。 它 们 产生 
相同 的 结果 ， 但 当 文 件 是 一 个 符号 链接 时 ，lstat 返 回 的 是 该 符号 链接 本 
身 的 信息 ， 而 stat 返 回 的 是 该 链接 指向 的 文件 的 信息 。 

stat 结 构 的 成 员 在 不 同 的 类 UNIX 系 统 上 会 有 所 变化 ， 但 一 般 会 包括 
表 3-4 中 所 示 的 内 容 。 


表 3-4 


stat 成 员 = ee ie 

t aode THKRRM TPS 
05 iE ME inode 
保存 文件 的 设备 
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”Stat 结构 中 返回 的 st_mode 标 志 还 有 一 些 与 之 关联 的 宏 ， 它 们 定义 在 
头 文 件 sys/stat.h 中 。 这 些 宏 包 括 对 访问 权限 、 文 件 类 型 标志 以 及 一 些 用 
于 帮助 测试 特定 类 型 和 权限 的 掩 码 的 定义 。 


访问 权限 标志 与 前 面 介绍 的 open 系 统 调 用 中 的 内 容 是 一 样 的 。 文 件 
类 型 标志 如 下 所 示 。 
S_IFBLK: 文件 是 一 个 特殊 的 块 设备 。 
S_IFDIR: 文件 是 一 个 目录 。 
S_IFCHR: 文件 是 一 个 特殊 的 字符 设备 。 
S_IFIFO: 文件 是 一 个 FIFO 〈 命 名 管道 ) 。 
S_IFREG: 文件 是 一 个 普通 文件 。 
S_FLNK: 文件 是 一 个 符号 链接 。 
下 是 其 他 模式 标志 。 
S_ISUID: 文件 设置 了 SUID 位 。 
S_ISGID: 文件 设置 了 SGID 位 。 
面 列 出 了 用 于 解释 st_mode 标 志 的 掩 码 。 
S_IFMT: 文件 类 型 。 
口 S_IRWXU: 属 主 的 读 / 写 /执行 权限 。 
O S_IRWXG: 属 组 的 读 / 写 /执行 权限 。 
口 S_IRWXO: 其 他 用 户 的 读 / 写 /执行 权限 。 
下 面 是 一 些 用 来 帮助 确定 文件 类 型 的 宏 定 义 。 它 们 只 是 对 经 过 掩 码 
处 理 的 模式 标志 和 相应 的 设备 类 型 标志 进行 比较 。 
S_ISBLK: 测试 是 否 是 特殊 的 块 设备 文件 。 
S_ISCHR: 测试 是 否 是 特殊 的 字符 设备 文件 。 
S_ISDIR: 测试 是 否 是 目录 。 
S_ISFIFO: 测试 是 否 是 FIFO。 
S_ISREG: 测试 是 否 是 普通 文件 。 
S_ISLNK: 测试 是 否 是 符号 链接 。 
例如 ， 如 果 想 测试 一 个 文件 代表 的 不 是 一 个 目录 ， 设 置 了 属 主 的 执 
行 权 限 ， 并 且 不 再 有 其 他 权限 ， 你 可 以 使 用 如 下 的 代码 进行 测试 : 


Ly a ea, SS cea a a 


OOOOdd 


at statbué 


mode_t modes; 


f£(!S_ISDIR(modes) && (modes & S_IRWXU) == S_IXUSR}) 


3. dup 和 dup2 系 统 调 用 

dup 系 统 调用 提供 了 一 种 复制 文件 描述 符 的 方法 ， 使 我 们 能 够 通过 
两 个 或 者 更 多 个 不 同 的 描述 符 来 访问 同一 个 文件 。 这 可 以 用 于 在 文件 的 
不 同位 置 对 数据 进行 读 写 。dup 系 统 调 用 复制 文件 朱 述 符 fildes， 返 回 一 
个 新 的 摘 述 符 。dup2 系 统 调用 则 是 通过 明确 指定 目标 描述 符 来 把 一 个 文 


件 描述 答复 制 为 男 外 一 个 。 
它们 的 原型 如 下 : 


#include <unistd.h> 


int dup(int fildes); 
int dup2(int fildes, int fildes2); 


当 你 通过 管道 在 多 个 进程 间 进 行 通信 时 ， 这 些 调用 也 很 有 用 
将 在 第 13 章 对 dup 系 统 调用 进行 深入 讨论 。 


。 我 们 


3.5 NENIO 


标准 MO 库 〈stdio) 及 其 头 文件 stdio.h 为 底层 MO 系统 调用 提供 了 一 
个 通用 的 接口 。 这 个 库 现 在 已 经 成 为 ANSI 标 准 C 的 一 部 分 ， 而 你 前 面 见 
到 的 系统 调用 却 还 不 是 。 标 准 IO 库 提供 了 许多 复杂 的 函数 用 于 格式 化 
输出 和 扫描 输入 。 它 还 负责 满足 设备 的 绥 冲 需求 。 

在 很 多 方面 ， 你 使 用 标准 MO 库 的 方式 和 使 用 底层 文件 描述 符 一 
样 。 你 需要 先 打开 一 个 文件 以 建立 一 个 访问 路 径 。 这 个 操作 的 返回 值 将 
作为 其 他 1/O 库 函数 的 参数 。 在 标准 1/O 库 中 ， 与 底层 文件 描述 符 对 应 的 
是 流 (stream) ， 它 被 实现 为 指 同 结构 FILE 的 指针 。 


注 章 ， 不 要 把 这 里 的 文件 流 与 C+t+ 语 言 中 的 输入 输出 流 
(iostream) 以 及 AT&T UNIXSystem V Release 3 中 引入 的 进程 间 通 
信 中 的 STREAMS 模 型 相 混 消 ，STEAMS 模 型 不 在 本 书 的 讨论 范围 
之 内 。 要 想 进 一 步 了 解 STREAMS， 请 查阅 X/Open 规范 


(http://www.opengroup.org) 和 随 System V 版 本 一 起 提供 的 
AT&TSTREAMS Programming Guide ( (AT&T STREAMS 程 序 设计 
Ha) ) o 


在 局 动 程序 时 ， 有 3 个 文件 流 是 自动 打开 的 。 它 们 是 stdin、stdout 和 和 
stderr。 它 们 都 是 在 stdio.h 头 文件 里 定义 的 ， 分 别 代表 着 标准 输入 、 标 准 
输出 和 标准 错误 输出 ， 与 底层 文件 描述 符 0、1 和 2 相对 应 。 

在 本 节 里 ， 我 们 将 介绍 标准 IO 库 中 的 下 列 库 函 数 : 
fopen、 fclose 
fread、fwrite 
fflush- 
fseek- 
fgetc、 getc、 getchar 
fputc、putc、putchar 
fgets、 gets 
printf. fprintf#Usprintf 
scanf, fscanf#llsscanf 


3.5.1 fopenpf ži 
fopen 库 函数 类 似 于 底层 的 open 系 统 调用 。 它 主要 用 于 文件 和 终端 


口 口 口 口 口 口 口 口 口 


Fan A at UR A is BET AC ETT Pa tll, AS Se FE AR AR A 
调用 ， 因 为 这 可 以 避免 用 库 函 数 带 来 的 一 些 潜在 问题 ， 如 输入 /输出 绥 


冲 。 
该 函数 原型 如 下 : 


#include <stdio.h> 


FILE *fopen(const char *filename, const char *mode); 


fopen 打 开 由 filename 参 数 指定 的 文件 ， 并 把 它 与 一 个 文件 流 关 联 起 
来 。 mode 参 数 指定 文件 的 打开 方式 ， 它 取 下 列 字 符 串 中 的 值 。 
“arb”: 以 只 读 方 式 打开 。 
“w” 或 “wb”: 以 写 方 式 打 开 ， 并 把 文件 长 度 截 短 为 零 。 
“a” 或 “ab”: 以 写 方式 打开 ， 新 内 容 奶 加 在 文件 尾 。 
ERDE ER THbo”: 以 更 新 方式 打开 〈 读 和 写 ) 。 
“w+” 或 “wb+” 或 “w+b”: 以 更 新 方式 打开 ， 并 把 文件 长 度 截 短 为 


“a+” 或 “ab+” 或 “atb”: 以 更 新 方式 打开 ， 新 内 容 奶 加 在 文件 
Æ. 
字母 b 表 示 文 件 是 一 个 二 进 制 文件 而 不 是 文本 文件 。 


请 注意 ，UNIX 和 Linux 并 不 像 MS-DOS 那 样 区 分 文本 文件 和 二 
进 制 文件 。UNIX 和 Linux 把 所 有 文件 都 看 作为 二 进 制 文 件 。 另 一 个 
需要 注意 的 地 方 是 mode 参 数 ， 它 必须 是 一 个 字符 串 ， 而 不 是 一 个 
字符 。 所 以 总 是 应 该 使 用 双 引 号 ， 而 不 是 单 引 号 。 


fopen 在 成 功 时 返回 一 个 非 空 的 FILE* 指 针 ， 失 败 时 返回 NULL 值 ， 
NULL 值 在 头 文件 stdio.h 里 定义 。 

可 用 的 文件 流 数 量 和 文件 描述 符 一 样 ， 都 是 有 限制 的 。 实 际 的 限制 
是 由 头 文 件 stdio.h 中 定义 的 FOPEN_MAX 来 定义 的 ， 它 的 值 至 少 为 8， 在 
Linux 系 统 中 ， 通 常 是 16。 


3.5.2 fread ži 


fread 库 函数 用 于 从 一 个 文件 流 里 读 取 数据 。 数 据 从 文件 流 stream 读 
到 由 ptr 指 向 的 数据 缓冲 区 里 。fread 和 fwrite 都 是 对 数据 记录 进行 操作 ， 
size 人 参数 指定 每 个 数据 记录 的 长 度 ， 计 数 器 nitems 给 出 要 传输 的 记录 个 
数 。 它 的 返回 值 是 成 功 读 到 数据 缓冲 区 里 的 记录 个 数 ( 而 不 是 字 节 
数 ) 。 当 到 达 文 件 尾 时 ， 它 的 返回 值 可 能 会 小 于 nitems， 甚 至 可 以 是 
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该 函数 原型 如 下 : 
#include <stdio.h> 


size_t fread(void *ptr, size_t size, size_t nitems, FILE *stream); 


对 所 有 疝 绥 冲 区 里 的 标准 WO 函数 来 说 ， 为 数据 分 配 空 a 
mae RN TE. WA WLAN E Ja X ferrorFlfeof K BA JT 


3.5.3 fwritepk ži 


fwrite Æ PK A -5 fread A AAR RO o E MAHE E a eX E h 
-o 并 把 它们 写 到 输出 流 中 。 它 的 返回 值 是 成 功 写 入 的 记录 个 


该 函数 原型 如 下 : 


#include <stdio.h> 


size t fwrite (const void *ptr, size_t size, size_t nitems, FILE *stream); 


请 注意 ， 我 们 不 推荐 把 fread 和 fwrite 用 于 结构 化 数据 。 部 分 原 
eee 于 不 同 的 计算 机 体系 结构 之 则 可 能 不 具备 
可 移 


3.5.4 _ fclose žk 


fclose 库 函数 关闭 指定 的 文件 流 stream， 使 所 有 尚未 写 出 的 数据 都 写 
出 。 因 为 stdio 库 会 对 数据 进行 缓冲 ， 所 以 使 用 fclose 是 很 重要 的 。 如 宋 
程序 需要 确保 数据 已 经 全 部 号 出 ， 就 应 该 调用 fclose 函 数 。 虽 然 当 程 厅 
正常 结束 时 ， 会 自动 对 所 有 还 打开 的 文件 流 调 用 fclose 函 数 ， 但 这 样 做 
你 就 没有 机 会 检查 由 fclose 报 告 的 错误 了 。 

该 函数 原型 如 下 : 


#include <stdio.h> 


int fclose(FILE *stream); 


3.5.5  fflush pk 2 
fflush 库 函数 的 作用 是 把 文件 流 里 的 所 有 未 写 出 数据 立刻 写 出 。 例 


Qo, PRAY HAXA eR OR HG RETA TEA AS | GP) A 
送出 一 个 交互 提示 符 。 使 用 这 个 函数 还 可 以 确保 在 程序 继续 执行 之 前 重 
要 的 数据 都 已 经 被 写 到 磁盘 上 。 有 时 在 调试 程序 时 ， 你 还 可 以 用 它 来 确 
认 程 序 是 正在 写 数据 而 不 是 被 挂 起 了 。 注 意 ， 调 用 fclose 函 数 隐 舍 执行 
了 一 次 flush 操 作 ， 所 以 你 不 必 在 调用 fclose 之 前 调用 fflush。 

该 函数 原型 如 下 : 


#include <stdio.h> 


int fflush(FILE *stream); 


3.5.6 fseek% 


fseek 函 数 是 与 jseek 系 统 调 用 对 应 的 文件 流 函 数 。 它 在 文件 流 里 为 下 
一 次 读 写 操作 指定 位 置 。offset 和 whence 参 数 的 含义 和 取 值 与 前 面 的 
lseek 系 统 调用 完全 一 样 。 但 lseek 返 回 的 是 一 个 off_t 数 值 ， 而 fseek 返 回 的 
是 一 个 整数 : 0 表示 成 功 ，-1 表 示 失 败 并 设置 errmmo 指 出 错误 。 

该 函数 原型 如 下 : 


#include <stdio.h> 


int fseek(FILE *stream, long int offset, int whence); 


3.5.7 fgetc. getc#! getcharph 2 


fgetc 函 数 从 文件 流 里 取出 下 一 个 字 节 并 把 它 作为 一 个 字符 返回 。 当 
它 到 达 文 件 尾 或 出 现 错误 时 ， 它 返回 EOF。 你 必须 通过 ferror 或 feof 来 区 
分 这 两 种 情况 。 

这 些 函 数 的 原型 如 下 : 


#include <stdio.h> 


int fgetc(FILE *stream) ; 

int getc(FILE *stream); 

int getchar(); 
p ”getc 函 数 的 作用 和 fgetc 一 样 ， 但 它 有 可 能 被 实现 为 一 个 宏 ， 如 果 是 
这 样 ，stream 人 参数 瓯 可 能 被 计算 不 止 一 次 ， 所 以 它 不 能 有 副作用 “〈 例 
如 ， 它 不 能 影响 变量 ) 。 此 外 ， 你 也 不 能 保证 能 够 使 用 getc 的 地 址 作为 
一 个 函数 指针 。 


getchar 函 数 的 作用 相当 于 getc (stdin) ， 它 从 标准 输入 里 读 取 下 一 
个 字符 。 


3.5.8 fputc. putc#! putchar rK Zz 


fputc 函 数 把 一 个 字符 写 到 一 个 输出 文件 流 中 。 它 返回 写 入 的 值 ， 如 
果 失 败 ， 则 返回 EOF。 


#include <stdio.h> 


int fputc(int c, FILE *stream); 
int putc(int c, FILE *stream); 
int putchar(int c); 


类 似 于 fgetc 和 getc 之 间 的 关系 ，putc 函 数 的 作用 也 相当 于 fputc， 但 
它 可 能 被 实现 为 一 个 宏 。 

putchar 函 数 相 当 于 putc (c, stdout) ， 它 把 单个 字符 写 到 标准 输 
出 。 注 意 ，putchar 和 getchar 都 是 把 字符 当 作 int 类 型 而 不 是 char 类 型 来 使 
用 的 。 这 就 允许 文件 尾 (EOF) 标识 取 值 -1， 这 是 一 个 超出 字符 数字 编 
码 范围 的 值 。 


3.5.9 ”fgets 和 gets 函 数 


fgets 函 数 从 输入 文件 流 stream 里 读 取 一 个 字符 串 。 


#include <stdio.h> 


char *fgets(char *s, int n, FILE *stream); 
char *gets(char *s); 


fgets 把 读 到 的 字符 写 到 s 指 向 的 字符 串 里 ， 直 到 出 现下 面 某 种 情 
mM: 过 到 换行 符 ， 已 经 传输 了 n-1 个 字符 ， 或 者 到 达 文 件 尾 。 它 会 把 通 
到 的 换行 符 也 传递 到 接收 字符 串 里 ， 再 加 上 一 个 表示 结尾 的 空 字 节 \0。 
一 次 调用 最 多 只 能 传输 n-1 个 字符 ， 因 为 它 必 须 把 空 字 节 加 上 以 结束 字 
FAB 

当成 功 完 成 时 ，fgets 返 回 一 个 指 同 字符 串 s 的 指针 。 如 果 文 件 流 已 
经 到 达 文 件 尾 ，fgets 会 设置 这 个 文件 流 的 EOF 标 识 并 返回 一 个 空 指 针 。 
如 果 出 现 读 错 误 ，fgets 返 回 一 个 空 指针 并 设置 errno 以 指出 错误 的 类 型 。 

gets 函 数 类 似 于 fgets， 只 不 过 和 它 从 标准 输入 读 取 数据 并 丢弃 遇 到 的 
换行 符 。 它 在 接收 字符 串 的 尾部 加 上 一 个 null 字 节 。 


注意 : gets 对 传输 字符 的 个 数 并 没有 限制 ， 所 以 它 可 能 会 溢出 
Aone x. AUC, PRA EEL IF fgets INS. YF 
多 安全 问题 都 可 以 退 溯 到 在 程序 中 使 用 了 可 能 造成 各 种 缓冲 区 溢出 
的 函数 ，gets 就 是 一 个 这 样 的 函数 ， 所 以 干 万 要 小 心 ! 


3.6 化 输入 和 和 输 


如 果 你 曾经 用 C 语 言 编写 过 程序 ， 那 么 你 应 该 对 那些 按 设计 格式 输 
出 数据 的 库 函 数 比 较 就 悉 。 这 些 了 水 数 包 括 问 一 个 文件 流 输 出 数据 的 
printf 系 列 函数 和 从 一 个 文件 流 读 取 数据 的 scanf 系 列 函 数 。 


3.6.1 printf. fprintf sprintf PK% 


printf 系 列 函 数 能 够 对 各 种 不 同类 型 的 参数 进行 格式 编排 和 输出 。 
每 个 参数 在 输出 流 中 的 表示 形式 由 格式 参数 format 控 制 ， 它 是 一 个 包 合 
再 要 输出 的 普通 字符 和 称 为 转换 控制 符 代 码 的 字符 串 ， 转 换 控制 符 规定 
了 其 余 的 参数 应 该 以 何 种 方式 被 输出 到 何 种 地 方 。 


#include <stdio.h> 


int printf(const char *format, ...); 
int sprintf(char *s, const char *format, ...); 
int fprintf(FILE *stream, const char *format, ...); 


printf K AGE A Far HS Bs ET. fprintf 函 数 把 目 己 的 输出 送 
到 一 个 指定 的 文件 流 。sprintf 函 数 把 目 己 的 输出 和 一 个 结尾 空 字符 写 到 
000 90 5 

printf 系 列 函 数 还 有 一 些 其 他 的 成 员 ， 它 们 以 各 目 不 同 的 方式 对 其 
参数 进行 处 理 。 更 详细 的 资料 请 参考 printf 的 手册 页 。 

普通 字符 在 输出 时 不 发 生变 化 。 转 换 控 制 符 让 printf 取 出 传递 过 来 
的 其 他 参数 并 对 它们 的 格式 进行 编排 。 转 换 控 制 符 总 是 以 % 字 符 开 头 。 
下 面 是 一 个 简单 的 例子 : 


pri “Some mbers: td, td, and tdin", 1 


它 在 标准 输出 上 产生 如 下 的 输出 : 
要 想 输出 % 字 符 ， 你 需要 使 用 %%， 这 样 就 不 会 与 转换 控制 符 混 消 
下 面 是 一 些 常用 的 转换 控制 符 。 


O %d, %i: 以 十 进 制 格式 输出 一 个 整数 。 
O %o，%x: 以 八进制 或 十 六 进 制 格式 输出 一 个 整数 。 


%c: 输出 一 个 字符 。 
%s: 输出 一 个 字符 串 。 
%f: 输出 一 个 ( 单 精度 ) 浮 点 数 。 
%e: 以 科学 计数 法 格式 输出 一 个 双 精 度 浮 点 数 。 
%g: 以 通用 格式 输出 一 个 双 精 度 浮 点 数 。 

TEM Bl printed 水 数 里 的 参数 数 日 和 类 型 与 format 字 符 串 里 的 转换 控 
制 符 相 匹配 是 非常 重要 的 。 整 数 参数 的 类 型 可 以 用 一 个 可 选 的 长 度 限定 
符 来 指定 。 它 可 以 是 hn， 例如 %hd 表 示 这 是 一 个 短 整数 (short int) ， 或 
痢 1， 例 如 %ld 表 未 这 万 一 个 长 又 数 Cong int) 。 有 的 编译 器 能 够 对 
printf 语 句 进行 检查 ， 但 并 非 万 无 一 失 。 如 果 你 使 用 的 是 GNU 编 译 器 
gcc， 你 可 以 在 编译 命令 中 添加 -Wformat 选 项 以 实现 这 一 功能 

下 面 是 另外 一 个 例子 : 


口 口 口 口 口 


iello Mr %c %s 


Gua 


Hello Mr A Matthe aged 13.5 


你 可 以 利用 字段 限定 答对 数据 的 输出 格式 做 进 一 步 的 控制 。 它 扩展 
了 转换 控制 符 的 功能 ， 使 得 转换 控制 符 能 够 对 输出 数据 的 间隔 进行 控 
ie “AT ALA ECR AR EP 

字段 限定 符 是 转换 控制 符 里 紧 跟 在 % 字 符 后 面 的 数字 。 表 3-5 中 列 出 
了 一 些 转换 控制 符 示 例 及 其 输出 情况 。 为 了 说 明 得 更 清楚 ， 我 们 用 垂直 
线 字符 来 表示 输出 边界 。 


上 表 中 的 所 有 示例 都 输出 到 一 个 10 个 字符 宽 的 区 域 里 。 注 意 : 负 值 
的 TEH 度 表示 数据 在 该 字段 里 以 左 对 齐 的 格式 输出 。 可 变 字 段 宽 度 用 
一 个 星 写 (*) 来 表示 。 在 这 种 情况 下 ， 下 一 个 参数 用 来 表示 字段 宽 。 
% 字 符 后 面 以 0 开头 表示 数据 前 面 要 用 数字 0 填充 。 根 据 POSIX 规 范 的 要 
求 ，printf 不 对 数据 字段 进行 截断 ， 而 是 扩充 数据 字段 以 适应 数据 的 帘 


度 。 因 此 ， 如 果 你 想 打 印 一 个 比 字 段 宽 度 长 的 字符 串 ， 数 据 字 段 会 加 
宽 ， 如 表 3-6 所 示 。 
表 3-6 


% x 参 ae: eee ® 出 | 
printf 函 数 返 回 一 个 整数 以 表明 它 输 出 的 字符 个 数 。 但 在 sprintf 的 返 
回 值 里 没有 算 上 结尾 的 那个 null 空 字符 。 如 果 发 生 错 误 ， 这 些 隙 数 会 返 
回 一 个 负 值 并 设置 errno。 


3.6.2 scanf, fscanf#lsscanf rK% 


scanf 系 列 函 数 的 工作 方式 与 printf 系 列 函 数 很 相似 ， 只 是 前 者 的 作 
用 是 从 一 个 文件 流 里 读 取 数据 ， 并 把 数据 值 放 到 以 指针 参数 形式 传递 过 
来 的 地 址 处 的 变量 中 。 它 们 也 使 用 一 个 格式 字符 串 来 控制 输入 数据 的 转 
换 ， 它 所 使 用 的 许多 转换 控制 符 都 与 printf 系 列 函 数 的 一 样 。 


#include <stdio.h> 


int scanf (const char *format, ...); 
int fscanf(FILE *stream, const char *format, ...); 
int sscanf(const char *s, const char *format, ...); 


scanf 函 数 读 入 的 值 将 保存 到 对 应 的 变量 里 去 ， 这 些 变 量 的 类 型 必须 
正确 ， 并 且 它 们 必须 精确 匹配 格式 字符 串 。 人 否则 ， 内 存 数 据 束 可 能 会 遭 
到 破坏 ， 从 而 使 程序 朋 误 。 编 译 器 是 不 会 对 此 做 出 错误 提示 的 ， 但 如 果 
你 运气 够 好 ， 你 可 能 会 看 到 一 个 警告 信息 ! 

scanf 系 列 函 数 的 format 格 式 字 符 串 里 同时 包含 着 普通 字符 和 转换 控 
制 符 ， 就 像 printf 函 数 中 一 样 。 但 在 scanf 系 列 函 数 中 ， 那 些 普通 字符 是 
用 于 指定 在 输入 数据 里 必须 出 现 的 字符 。 

下 面 是 一 个 简单 的 例子 : 


int num; 
scanf ("Hello $d", &num); 


这 个 scanf 调 用 只 有 在 标准 输入 中 接 下 来 的 五 个 字符 匹配 “Hello” 的 
情况 下 才 会 成 功 。 然 后 ， 如 果 后 面 的 字符 构成 了 一 个 可 识别 的 十 进 制 数 
字 ， 该 数字 就 将 被 读 入 并 赋值 给 变量 num。 格 式 字 符 串 中 的 空格 用 于 久 
略 输入 数据 中 位 于 转换 控制 符 之 间 的 各 种 空白 字符 (空格 、 制 表 符 、 换 
页 符 和 换行 符 ) 。 这 意味 着 在 下 面 两 种 输入 情况 下 ， 这 个 scanf 调 用 都 会 
执行 成 功 ， 并 把 1234 放 到 变量 num 里 : 


Hello 1234 
Hellol234 


输入 的 空白 字符 在 进行 数据 转换 时 一 般 也 会 被 忽略 。 这 意味 着 ， 格 
式 字 符 串 %d 将 持续 读 取 输入 ， 急 略 空格 和 换行 符 ， 直 到 找到 一 组 数字 
为 止 。 如 有 果 预 期 的 字符 没有 在 输入 流 里 出 现 ， 转 换 将 失败 ，scanf 也 将 返 
回 。 


如 果 不 注 意 ， 这 会 产生 问题 。 如 采用 户 在 输入 中 应 该 出 现 一 个 
E T R E 
循环 。 


下 面 是 一 些 其 他 的 转换 控制 符 。 
%d: 读 取 一 个 十 进 制 整数 。 
%0, %x: 读 取 一 个 八进制 或 十 六 进 制 整数 。 
%f、%e、%g: 读 取 一 个 浮 点 数 。 
%c: 读 取 一 个 字符 (不 会 忽略 空格 〉。 
%s: 读 取 一 个 字符 串 。 
%[]: 读 取 一 个 字符 集合 〈 见 下 面 的 说 明 ) 。 
%%: 读 取 一 个 % 字 符 。 

类 似 于 printf，scanf 的 转换 控制 符 里 也 可 以 加 上 对 输入 数据 字段 宽 
度 的 限制 。 长 度 限定 符 (h 对 应 于 短 ，1 对 应 于 长 ) 指明 接收 参数 的 长 度 
是 否 比 默认 情况 更 短 或 更 长 。 这 意味 着 ，%hd 表 示 要 读 入 一 个 短 整 数 ， 
%1d 表 示 要 读 入 一 个 长 整数 ， 而 %1g 表 示 要 读 入 一 个 双 精 度 浮 点 数 。 

UES E) 开头 的 控制 符 表 示 对 应 位 置 上 的 输入 数据 将 被 忽略 。 
这 意味 着 ， 这 个 数据 不 会 被 保存 ， 因 此 不 需要 使 用 一 个 变量 来 接收 它 。 
i 我 们 使 用 %c 控 制 符 从 输入 中 读 取 一 个 字符 。 它 不 会 跳 过 起 始 的 空 
字符 。 

我 们 使 用 %s 控 制 符 来 扫描 字符 串 ， 但 使 用 时 必须 小 心 。 它 会 跳 过 
起 始 的 空白 字符 ， 并 且 会 在 字符 串 里 出 现 的 第 一 个 空白 字符 处 停 下 来 ， 
所 以 ， 你 最 好 用 它 来 读 取 单词 而 不 是 一 般 意 义 上 的 字符 串 。 此 外 ， 如 果 
没有 使 用 字段 宽度 限定 符 ， 它 能 够 读 取 的 字符 串 的 长 度 是 没有 限制 的 ， 
所 以 接收 字符 串 必须 有 足够 的 空间 来 容纳 输入 流 中 可 能 的 最 长 字符 串 。 
较 好 的 选择 是 使 用 一 个 字段 限定 符 ， 或 者 结合 使 用 fgets 和 sscanf 从 输入 
中 读 入 一 行 数据 ， 再 对 它 进行 扫描 。 这 样 可 以 避免 可 能 被 恶意 用 户 利用 
的 缓冲 区 溢出 。 

我 们 使 用 %[] 控 制 符 读 取 由 一 个 字符 集合 中 的 字符 构成 的 字符 串 。 
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格式 字符 串 %[A-Z] 将 读 取 一 个 由 大 写字 母 构成 的 字符 串 。 如 果 字 符 集 
中 的 第 一 个 字符 是 ^， 就 表示 将 读 取 一 个 由 不 属于 该 字符 集合 中 的 字符 
构成 的 字符 串 。 因 此 ， 读 取 一 个 其 中 带 空 格 的 字符 串 ， 并 且 在 过 到 第 一 
个 逗号 时 停止 ， 你 可 以 用 %[^，]。 

给 定 下 面 输入 行 : 


end É the 


下 面 的 scanf 调 用 会 正确 读 入 4 个 数据 项 : 


scanf 函 数 的 返回 值 是 它 成 功 读 取 的 数据 项 个 数 ， 如 果 在 读 第 一 个 数 
据 项 时 失败 了 ， 它 的 返回 值 就 将 是 零 。 如 采 在 匹配 第 一 个 数据 项 之 前 就 
己 经 到 达 了 输入 的 结尾 ， 它 就 会 返回 EOF。 如 果 文 件 流 发 生 读 错 误 ， 流 
错误 标志 就 会 被 设置 并 且 错 误 变 量 ermo 将 被 设置 以 指明 错误 类 型 。 详 细 
情况 请 参考 本 章 3.6.4 市 中 的 内 容 。 
一 般 来 说 ， 对 scanf 系 列 函数 的 评价 并 不 高 ， 这 主要 有 下 面 3 方面 原 
Al 

O 从 历史 来 看 ， 它 们 的 具体 实现 都 有 漏洞 。 

O 它们 的 使 用 不 够 灵活 。 

口 “使 用 它们 编写 的 代码 不 容易 看 出 究竟 正在 解析 什么 。 

此 外 ， 你 应 答 试 使 用 其 他 函数 ， 如 fread 或 fgets 来 读 取 输 入 行 ， 再 用 
字符 串 函数 把 输入 分 解 成 你 需要 的 数据 项 。 


3.6.3 Hihi PK 


stdio PAI žit E EA — E HE AY R UE H it BS BB ho HE Vt stdin. 
stdout 和 stderr， 如 下 所 示 。 
fgetpos: 获得 文件 流 的 当前 《〈 读 写 ) 位 置 。 
fsetpos: 设置 文件 流 的 当前 ( 读 写 ) 位 置 。 
ftell: 返回 文件 流 当 前 ( 读 写 ) 位 置 的 偏 移 值 。 
rewind: 重 置 文件 流 里 的 读 写 位 置 。 
freopen: 重新 使 用 一 个 文件 流 。 
setvbuf: 设置 文件 流 的 缓冲 机 制 。 
remove: 相当 于 unlink 函 数 ， 但 如 果 它 的 path 参 数 是 一 个 目录 的 
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话 ， 其 作用 就 相当 于 rmdir 函 数 。 

所 有 这 些 库 函数 在 手册 页 的 第 三 节 中 都 有 说 明 。 

你 可 以 使 用 文件 流 函 数 来 重新 实现 前 面 的 文件 复制 程序 。 请 看 下 面 
的 copy_stdio.c 程 序 。 


实 验 第 三 个 文件 复制 程序 
这 个 程序 与 前 面 的 版 本 很 相似 ， 但 逐个 字符 的 复制 工作 改 为 通过 调 
用 stdio.h 头 文件 里 定义 的 函数 来 完成 : 


@include <stdio. 


while 


像 前 面 那样 运行 这 个 程序 ， 你 得 到 的 结果 是 : 


$ TIMEFORMAT="" time ./copy stdio 


0.06user 0.02system 0:00.llelapsed 81%CPU 


实验 解析 

这 一 次 程序 运行 了 0.11 秒 ， 虽 然 不 如 确 层 数据 块 复制 版 本 快 ， 但 比 
那个 一 次 复制 一 个 字符 的 版 本 要 快 得 多 。 这 是 因为 stdio 库 在 FILE 结 构 
里 使 用 了 一 个 内 部 缓冲 区 ， 只 有 在 缓冲 区 满 时 才 进 行 底层 系统 调用 。 读 
者 可 以 利用 stdio 库 函数 自行 编写 出 实现 逐 行 复制 和 数据 块 复制 的 程序 ， 
将 它们 的 执行 性 能 与 我 们 在 本 章 里 给 出 的 3 个 示例 程序 进行 比较 。 


3.6.4 ”文件 流 错 误 
为 了 表明 错误 ， 许 多 stdio 库 函数 会 返回 一 个 超出 范围 的 值 ， 比 如 罕 
指针 或 EOF 第 数 。 此 时 ， 错 误 由 外 部 变量 errno 指 出 : 


#include <errno.h> 


extern int errno; 


注意 ， 许 多 函数 都 可 能 改变 errmmo 的 值 。 它 的 值 只 有 在 函数 调用 
失败 时 才 有 意义 。 你 必须 在 函数 表明 失败 之 后 立刻 对 其 进行 检查 。 
你 应 该 总 是 在 使 用 它 之 前 将 它 先 复制 到 男 一 个 变量 中 ， 因 为 像 
fprintf 这 样 的 输出 函数 本 身 就 可 能 改变 ermo 的 值 。 


你 也 可 以 通过 检 碍 文件 流 的 状态 来 确定 是 否 发 生 了 错误 ， 或 者 是 否 
到 达 了 文件 尾 。 


#include <stdio.h> 


int ferror(FILE *stream); 
int feof (FILE *stream); 
void clearerr (FILE *stream); 


ferror 函 数 测试 一 个 文件 流 的 错误 标识 ， 如 果 该 标识 被 设置 就 返回 
一 个 非 零 值 ， 否 则 返回 零 。 

feof 函 数 测试 一 个 文件 流 的 文件 尾 标识 ， 如 果 访 标识 被 设置 就 返回 
非 零 值 ， 否 则 返回 零 。 我 们 可 以 像 下面 这 样 使 用 它 : 


if (feof (some_stream) ) 


和 SÍ ~ s fs 1 & 
/* We're at the end 
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误 标 识 。 它 没有 返回 值 ， 也 未 定义 任何 错误 。 你 可 以 通过 使 用 它 从 文件 
流 的 错误 状态 中 恢复 。 例 如 ， 在 “磁盘 已 满 * 错 误解 决 之 后 ， 继 续 开 始 写 
入 文件 流 。 


3.6.5 


每 个 文件 流 都 和 一 个 奔 层 文件 搬 述 符 相 关联 。 你 可 以 把 后 层 的 输入 
输出 操作 与 高 层 的 文件 流 操 作 混合 使 用 ， 但 一 般 来 说 ， 这 并 不 是 一 个 明 
智 的 做 法 ， 因 为 数据 缓冲 的 后 果 难 以 预料 。 


#include <stdio.h> 


int fileno(FILE *stream); 
FILE *fdopen(int fildes, const char *mode); 
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述 符 。 它 返回 指定 文件 流 使 用 的 文件 描述 符 ， 如 失败 就 返回 -1。 如 果 你 
需要 对 一 个 己 经 打开 的 文件 流 进行 底层 访问 时 《例如 ， 对 它 调用 
fstat) ， 这 个 函数 将 很 有 用 。 


你 可 以 通过 调用 fdopen 函 数 在 一 个 已 打开 的 文件 描述 符 上 创建 一 个 
新 的 文件 流 。 实 质 上 ， 这 个 函数 的 作用 是 为 一 个 已 经 打开 的 文件 描述 符 
提供 stdio 组 种 区 ， 这 样 解释 可 能 更 容易 理解 一 些 。 

fdopen 函 数 的 操作 方式 与 fopen 函 数 是 一 样 的 ， 只 是 前 者 的 参数 不 是 
一 个 文件 名 ， 而 是 一 个 底层 的 文件 描述 符 。 如 果 你 已 经 通过 open 系 统 调 
用 创建 了 一 个 文件 (可 能 是 出 于 为 了 更 好 地 控制 其 访问 权限 的 目的 〉， 
但 又 想 通 过 文件 流 来 对 它 进 行 写 操作 ， 这 个 函数 就 很 有 用 了 。fdopen 函 
数 的 mode 参 数 与 fopen 函 数 的 完全 一 样 ， 但 它 必 须 符 合 该 文件 在 最 初 打 
开 时 所 设 定 的 访问 模式 。fdopen 返 回 一 个 新 的 文件 流 ， 失 败 时 返回 
NULL. 
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标准 库 和 系统 调用 为 文件 和 目录 的 创建 与 维护 提供 了 全 面 的 支持 。 
3.7.1 ” chmod 系统 调用 


你 可 以 通过 chmod 系 统 调 用 来 改变 文件 或 目录 的 访问 权限 。 这 构成 
了 shell 程 序 chmod 的 基础 。 
该 函数 原型 如 下 : 


#include <sys/stat.h> 


int chmod(const char *path, mode t mode); 


path 参 数 指定 的 文件 被 修改 为 具有 mode 参 数 给 出 的 访问 权限 。 人 参数 
mode 的 定义 与 open 系 统 调 用 中 的 一 样 ， 也 是 对 所 要 求 的 访问 权限 进行 按 
位 OR 操 作 。 除 非 程序 被 赋予 适当 的 特权 ， 人 否则 只 有 文件 的 属 主 或 超级 
用 户 可 以 修改 它 的 权限 。 


3.7.2 ”chown 系 统 调用 


超级 用 户 可 以 使 用 chown 系 统 调用 来 改变 一 个 文件 的 属 主 。 


#include <sys/types.h> 
#include <unistd.h> 


int chown(const char *path, uid_t owner, gid t group); 


这 个 调用 使 用 的 是 用 户 ID 和 组 ID 的 数字 值 (通过 getuid 和 getgid 调 用 
获得 ) 和 一 个 用 于 限定 谁 可 以 修改 文件 属 主 的 系统 值 。 如 果 已 经 设置 了 
适当 的 特权 ， 文 件 的 属 主 和 所 属 组 就 会 改变 。 


POSIX 规 范 实际 上 允许 非 超 级 用 户 改变 文件 的 属 主 。 虽 然 所 
有 “正确 的 "POSIX 系 统 都 不 允许 这 样 做 ， 但 严格 来 说 ， 这 是 它 的 一 
个 扩展 规定 (FIPS 151-2) 里 要 求 的 。 我 们 在 本 书 里 讨论 的 系统 都 
遵守 XSI (X/Open System Interface，X/Open 系 统 接口 ) 规范 ， 并 且 
执行 文件 的 所 有 权 规 则 。 


你 可 以 使 用 unlink 系 统 调用 来 删除 一 个 文件 。 

unlink 系 统 调用 删除 一 个 文件 的 目录 项 并 减少 它 的 链接 数 。 它 在 成 
功 时 返回 0， 失 败 时 返回 -1。 如 果 想 通过 调用 这 个 函数 来 成 功 删 除 文 
件 ， 你 就 必须 拥有 该 文件 所 属 目录 的 写 和 执行 权限 。 


#include <unistd.h> 


int unlink(const char *path); 
int link(const char *pathl, const char *path2); 
int symlink(const char *pathi, const char *path2); 


如 末 一 个 文件 的 链接 数 减少 到 零 ， 并 且 没 有 进程 打开 它 ， 这 个 文件 
就 会 被 删除 。 事 实 上 ， 目 录 项 总 是 被 立刻 删除 ， 但 文件 所 占用 的 空间 要 
等 到 最 后 一 个 进程 《如 条 有 的 话 ) 关闭 它 之 后 才 会 被 系统 回收 。rm 程 序 
使 用 的 束 是 这 个 调用 。 文 件 上 其 他 的 链接 表示 这 个 文件 还 有 其 他 名 字 ， 
这 通常 是 由 In 程序 创建 的 。 你 可 以 使 用 link 系 统 调 用 在 程序 中 创建 一 个 
文件 的 新 链接 。 


先 用 open 创 建 一 个 文件 ， 然 后 对 其 调用 unlink 是 某 些 程序 员 用 
来 创建 临时 文件 的 技巧 。 这 些 文件 只 有 在 被 打开 的 时 候 才 能 被 程序 
使 用 ， 当 程序 退出 并 且 文件 关闭 的 时 候 它 们 就 会 被 自动 删除 掉 。 


link 系 统 调 用 将 创建 一 个 指向 已 有 文件 path1 的 新 链接 。 新 目录 项 由 
path2 给 出 。 你 可 以 通过 symlink 系 统 调用 以 类 似 的 方式 创建 符号 链接 。 
注意 ， 一 个 文件 的 符号 链接 并 不 会 增加 该 文件 的 链接 数 ， 所 以 它 不 会 像 
普通 〈 硬 ) 链接 那样 防止 文件 被 删除 。 


你 可 以 使 用 mkdir 和 rmdir 系 统 调用 来 建立 和 删除 目录 。 


#include <sys/types.h> 
#include <sys/stat.h> 


int mkdir(const char *path, mode_t mode); 


mkdir 系 统 调用 用 于 创建 目录 ， 它 相当 于 mkdir 程 序 。mkdir 调 用 将 参 
数 path 作 为 新 建 目 录 的 名 字 。 目 录 的 权限 由 参数 mode 设 定 ， 其 含义 将 按 
open 系 统 调用 的 O _CREAT 选 项 中 的 有 关 和 定义 设置 。 当 然 ， 它 还 要 服从 
umask 的 设置 情况 。 


#include <unistd.h> 


int rmdir(const char *path); 


rmdir 系 统 调用 用 于 删除 目录 ， 但 只 有 在 目录 为 空 时 才 行 。rmdir 程 


序 就 是 用 这 个 系统 调用 来 完成 工作 的 。 


程序 可 以 像 用 户 在 文件 系统 里 那样 来 浏览 目录 。 就 像 你 在 shell 里 使 
用 cd 命令 来 切换 目录 一 样 ， 程 序 使 用 的 是 chdir 系 统 调用 。 


#include <unistd.h> 


int chdir(const char *path); 


程序 可 以 通过 调用 getcwd 函 数 来 确定 自己 的 当前 工作 目录 


#include <unistd.h> 


char *getcwd(char *buf, size_t size); 


getcwd 函 数 把 当前 目录 的 名 字 写 到 给 定 的 缓冲 区 buf 里 。 如 果 目 录 
名 的 长 度 超出 eg ea KKE (一 个 ERANGE 错 误 ) ， 它 
就 返回 NULL。 如 果 成 功 ， 它 返回 指针 buf。 


如 采 在 程序 运行 过 程 中 ， 目 录 被 删除 CEINVAL 错 误 ) 或 者 有 
关 权 限 发 生 了 变化 “EACCESS 错 误 ) ，getcwd 也 可 能 会 返回 
NULL. 
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录 下 存放 的 文件 。 在 shell 程 序 设 计 中 ， 这 很 容易 做 到 一 一 只 需 让 shell 做 
一 次 表达 式 的 通配符 扩展 。 在 过 去 ，UNIX 操 作 系 统 的 各 种 变 体 都 允许 
用 户 通 过 编程 访问 底层 文件 系统 结构 。 你 仍然 可 以 把 目录 当 作 一 个 普通 
文件 那样 打开 ， 并 直接 读 取 目 录 数 据 项 ， 但 不 同 的 文件 系统 结构 及 其 实 
现 已 经 使 这 种 方法 没什么 可 移植 性 了 。 现 在 ， 一 整套 标准 的 库 函 数 已 经 
被 开发 出 来 ， 使 得 目录 的 扫描 工作 变 得 简单 多 了 。 

与 目录 操作 有 关 的 函数 在 dirent.h 头 文件 中 声明 。 它 们 使 用 一 个 名 为 
DIR 的 结构 作为 目录 操作 的 基础 。 被 称 为 目录 流 的 指向 这 个 结构 的 指针 
(DIR*) 被 用 来 完成 各 种 目录 操作 ， 其 使 用 方法 与 用 来 操作 普通 文件 
的 文件 流 (FILE *) 非 党 相似。 目录 数据 项 本 丑 则 在 dirent 结 构 中 返回 ， 
该 结构 也 是 在 dirent.h 头 文件 里 声明 的 ， 这 是 因为 用 户 不 应 直接 改动 DIR 
结构 中 的 数据 字段 。 

我 们 将 介绍 下 面 这 几 个 函数 : 
opendir、 closedir 
readdir 
telldir 
seekdir 
closedir 


3.8.1 opendir Pf 2 


opendir 函 数 的 作用 是 打开 一 个 目录 并 建立 一 个 目录 流 。 如 果 成 功 ， 
它 返 回 一 个 指向 DIR 结 构 的 指针 ， 该 指针 用 于 读 取 目录 数据 项 。 
#include <sys/types.h> 
#include <dirent.h> 
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DIR *opendir(const char *name); 


opendir 在 失败 时 返回 一 个 空 指针 。 注 意 ， 目 录 流 使 用 一 个 底层 文件 
人 
败 。 


3.8.2  readdir px ži 


readdir 函 数 返 回 一 个 指针 ， 该 指针 指 回 的 结构 里 保存 着 目录 流 dirp 
中 下 一 个 目录 项 的 有 关 资 料 。 后 续 的 readdir 调 用 将 返回 后 续 的 目录 项 。 
如 果 发 生 错 误 或 者 到 达 目 录 尾 ，readdir 将 返回 NULL。POSIX 兼 容 的 系 
统 在 到 达 目 录 尾 时 会 返回 NULL， 但 并 不 改变 errmno 的 值 ， 只 有 在 发 生 错 
误 时 才 会 设置 ermno。 
#include <sys/types.h> 
#include <dirent.h> 


struct dirent *readdir(DIR *dirp); 


注意 ， 如 果 在 readdir 函 数 扫描 目录 的 同时 还 有 其 他 进程 在 该 日 录 里 
am 除 文件 ，readdir 将 不 保证 能 够 列 出 该 目录 里 的 所 有 文件 CAI 
dirent 结 构 中 包含 的 目录 项 内 容 包 括 以 下 部 分 。 
O ino_td_ino: 文件 的 inode 节 点 号 。 
o char d_name[]: 文件 的 名 字 。 
aaa 了 解 目录 中 某 个 文件 ， 你 需要 使 用 在 本 章 前 面 介 绍 过 的 
Stata Š 


3.8.3 telldirPÃ 24 


telldir 函 数 的 返回 值 记录 着 一 个 目录 流 里 的 当前 位 置 。 你 可 以 在 随 
后 的 seekdir 调 用 中 利用 这 个 值 来 重 置 目录 扫描 到 当前 位 置 。 


#include <sys/types.h> 
#include <dirent.h> 


long int telldir(DIR *dirp); 


3.8.4 seekdir ph % 
seekdir 函 数 的 作用 是 设置 目录 流 dirp 的 目录 项 指针 。loc 的 值 用 来 设 
置 指针 位 置 ， 它 应 该 通过 前 一 个 telldir 调 用 获得 。 


#include <sys/types.h> 
#include <dirent.h> 


void seekdir(DIR *dirp, long int loc); 


3.8.5  closedir pki 2 


closedir 函 数 关 闭 一 个 目录 流 并 释放 与 之 关联 的 资源 。 它 在 执行 成 功 
时 返 同 0， 发 生 错误 时 返回 - 1. 


#include <sys/types.h> 
#include <dirent.h> 


int closedir(DIR *dirp); 


在 下 面 的 printdir.c 程 序 中 ， 你 将 把 许多 文件 处 理 函 数 集 中 在 一 起 以 
实现 一 个 简单 的 目录 列表 功能 。 目 录 中 的 每 个 文件 单独 列 在 一 行 上 。 
个 子 目 录 会 在 它 的 名 字 后 面 加 上 一 个 和 斜 线 字符 /， 子 目录 中 的 文件 在 颖 
进 四 个 空格 后 依次 排列 。 

程序 会 逐个 切换 到 每 个 下 级 子 目 录 里 ， 这 样 使 它 找 到 的 文件 都 有 一 
个 可 用 的 名 字 。 也 惑 是 说 ， 它 们 都 可 以 被 直接 传递 给 opendir 函 数 。 如 果 
目录 的 侍 套 层次 太 深 ， 程 序 执行 就 会 失败 ， 这 是 因为 对 允许 打开 的 目录 
流 数 目 是 有 限制 的 。 

我 们 当然 可 以 采取 一 个 更 通用 的 做 法 ， 让 程序 能 够 通过 一 个 命令 行 
参数 来 指定 起 点 〈 从 哪个 目录 开始 ) 。 请 查阅 有 关 工 具 程 序 〈 如 ]s 和 
find) 的 Linux 源 代码 来 找到 实现 更 通 UE. 


X 验 一 个 目标 扫描 程序 

C1) 程序 的 开始 是 一 些 必 要 的 头 文 件 。 接 下 来 是 printdir 函 数 ， 它 
的 作用 是 输出 当前 目录 的 内 容 。 它 将 递归 通 历 各 级 子 目 录 ， 使 用 depth 
参数 来 控制 缩 排 。 


@include <dirent.h> 
@include <string.h> 
@include <sys/stat.h> 
#include <stdlib.h> 


void printdir(char *dir, int depth) 
{ 

DIR *dp; 

struct dirent *entry; 

struct stat statbuf; 


ift((@p = opendir(dir)) == NULL) { 
fprintf(stderr, cannot open directory: ts\n‘, dir); 
return; 
} 
chdir{dir)}); 
while{ [entry = readdir(dp)}) j= NULL) { 
lstat (entry->d_name, &statbuf); 
if(S_ISDIRistatbuf.st_mode)) { 
/* Pound a directory, but ignore . and .. */ 
if(stroemp(*.*,entry->d_name) == 0 || 
stromp(*..*,entry->d_name) == 0) 
continue; 
printf (*$*sts/\n*, depth, **, entry->d_name); 
/* Recurse at a new indent level */ 
printdir(entry->d_name,depth+4)}; 
} 
else printf (*t*ste\n*, depth, **,entry->d_nane); 


ae: Ta E 

closedir [dp}); 
} 

(2) 下 面 是 main 函 数 
int main() 


printf£(“Directory scan of /home:\n"); 
printdir(*"/home*, 0); 
printf (*done.\n*); 


exit(0); 


这 个 程序 扫描 home 目 录 并 产生 如 下 所 示 的 输出 〈 经 过 简化 ) 。 如 
果 想 扫描 其 他 用 户 的 目录 ， 你 可 能 需要 超级 用 户 的 权限 。 


$ ./printdir 
Directory scan of /home: 
neil/ 
.Xdefaults 
. Xmodmap 
.Xresources 
.bash_history 
.bashrc 


实验 解析 

绝 大 部 分 操作 都 是 在 printdir 函 数 里 完成 的 。 在 用 opendir 函 数 检 查 完 
指定 目录 是 否 存在 后 ，printdir 调 用 chdir 进 入 指定 目录 。 如 果 readdir 函 数 
返回 的 数据 项 不 为 宇 ， 程 序 束 检查 该 数据 项 是 否 是 一 个 目录 。 如 果 不 
是 ， 程 序 束 根据 depth 的 值 缩 进 打印 该 文件 数据 项 的 内 容 。 

如 果 该 数据 项 是 一 个 目录 ， 你 就 需要 对 它 进行 递归 表 历 。 在 跳 过 . 
和 .. 数 据 项 (它们 分 别 代表 当前 目录 和 上 一 级 目录 〉 后 ，printdir 函 数 调 
用 目 己 并 再 次 进入 一 个 同样 的 处 理 过 程 。 那 它 又 是 如 何 退出 这 些 循环 的 
We? 一 旦 while 循 环 完 成 ，chdir(“..”) 调用 将 把 它 带 回 到 目录 树 的 上 一 
级 ， 从 而 可 以 继续 进行 上 级 目录 的 壳 历 。 调 用 closedir (dp) 关闭 目录 
是 为 了 确保 打开 的 目录 流 数 目 不 超出 其 需要 。 

作为 对 第 4 章 所 介绍 的 Linux 环 境 的 一 个 简短 尝试 ， 让 我 们 来 看 一 个 
能 够 使 这 个 程序 更 具 通 用 性 的 方法 。 这 个 程序 的 功能 受 限 是 因为 它 只 能 
对 目录 /home 进 行 操作 。 如 果 我 们 按 下 面 的 方法 对 main 函 数 进行 修改 ， 
就 能 把 它 变 成 一 个 更 有 用 的 目录 浏览 器 : 


我 们 修改 了 3 条 语句 ， 增 加 了 5 条 语句 ， 它 现在 是 一 个 通用 的 工具 程 
序 了 。 它 多 了 一 个 可 选 的 目录 名 参数 ， 其 默认 值 是 当前 目录 。 你 可 以 通 
过 下 面 的 命令 运行 它 : 


$ ./printdir2 /usr/local | sore 


输出 结果 将 分 页 显示 ， 用 户 可 以 通过 翻 页 查看 其 输出 。 可 以 说 ， 用 
户 现 在 有 了 一 个 非常 方便 、 通 用 的 目录 树 浏览 囊 。 你 不 必 人 花费 过 多 精力 
就 可 以 为 这 个 程序 再 增加 空间 占用 统计 、 通 历 深度 限制 等 其 他 功能 。 


3.9 FEAA 


正如 你 已 经 看 到 的 ， 本 章 介 绍 的 许多 系统 调用 和 函数 都 会 因为 各 种 
各 样 的 原因 而 失败 。 它 们 会 在 失败 时 设置 外 部 变量 ermo 的 值 来 指明 失败 
的 原因 。 许 多 不 同 的 函数 库 都 把 这 个 变量 用 做 报告 错误 的 标准 方法 。 值 
得 重申 的 是 ， 程 序 必须 在 函数 报告 出 错 之 后 立刻 检查 errno 变 量 ， 因 为 它 
可 能 被 下 一 个 函数 调用 所 者 施 ， 即使 下 一 个 函数 自身 并 没有 出 钳 ， 也 可 
me 这 个 变量 。 
错误 代码 的 取 值 和 含义 都 列 在 头 文件 errno.h 里 ， 如 下 所 示 。 
EPERM: 操作 不 允许 。 

ENOENT: 文 件 或 目录 不 存在 。 
EINTR: 系统 调用 被 中 断 。 
EIO: IO 错误 。 
EBUSY: 设 备 或 资源 忙 。 
EEXIST: 文 件 存在 。 
EINVAL: CREA. 
EMFILE: 打 开 的 文件 过 多 。 
ENODEV: 设备 不 存在 。 
EISDIR: 是 一 个 目录 。 
ENOTDIR: 不 是 一 个 目录 。 

有 两 个 非常 有 用 的 凶 数 可 以 用 来 报告 出 现 的 错误 ， 它 们 是 strerror 和 


perror. 


ee 


3.9.1  strerrorps 2 


strerror 国 数 把 错误 代码 映射 为 一 个 字符 串 ， 该 字符 串 对 发 生 的 错误 
类 型 进行 说 明 。 这 在 记录 错误 条 件 时 十 分 有 用 。 
该 函数 原型 如 下 : 


#include <string.h> 


char *strerror(int errnum); 


3.9.2 perrorph 2 


perror es žiti łEern tE PF Ta AY “SA Fe RR BI — “NB, IF 
把 它 输出 到 标准 错误 输出 流 。 该 字符 串 的 前 面 先 加 上 字符 串 s (如 果 不 
为 空 ) 中 给 出 的 信息 ， 再 加 上 一 个 冒号 和 一 个 空格 。 

该 函数 原型 如 下 : 


#include <stdio.h> 


void perror (const char *s); 
请 看 下 面 的 例子 : 


它 可 能 在 标准 错误 输出 中 给 出 如 下 的 输出 结 


program: Te A 


3.10 /procs A 


我 们 在 前 面 提 到 过 ，Linux 将 一 切 事 物 都 看 作为 文件 ， 硬 件 设 备 在 
文件 系统 中 也 有 相应 的 条 目 。 我 们 使 用 底层 系统 调用 这 样 一 种 特殊 方式 
通过 /dev 目 录 中 的 文件 来 访问 硬件 。 

控制 硬件 的 软件 驱动 程序 通常 可 以 以 某 种 特定 方式 配置 ， 或 者 能 够 
报告 相关 人 信息。 例如， 一 个 硬盘 控制 程序 可 以 被 配置 为 使 用 一 个 特殊 的 
DMA 模 式 。 一 块 网 卡 可 以 报告 它 是 否 协商 了 一 个 高 速 、 双 工 的 连接 。 

用 于 与 设备 驱动 程序 进行 通信 的 工具 在 过 去 整 已 经 十 分 常见。 例 
如 ，hdparm 可 以 用 来 配置 一 些 磁盘 参数 ，ifconfig 可 以 报告 网 络 统计 信 
晨 。 近 年 来 ， 倾 回 于 提供 更 一 致 的 方式 来 访问 驱动 程序 的 信息 。 事 实 
上 ， 这 种 一 致 的 方式 甚至 延伸 到 包括 与 Linux 内 核 的 各 种 元 素 的 通信 。 

Linux 提 供 了 一 个 特殊 的 文件 系统 procfs， 它 通常 以 /proc 目 录 的 形式 
呈现 。 该 目录 中 包含 了 许多 特殊 文件 用 来 对 驱动 程序 和 内 核 信息 进行 更 
高 层 的 访问 。 只 要 应 用 程序 有 正确 的 访问 权限 ， 它 们 就 可 以 通过 读 写 这 
些 文 件 来 获得 信息 或 设置 参数 。 

/proc 目 录 中 的 文件 会 随 系统 的 不 同 而 不 同 ， 当 Linux 版 本 中 有 更 多 
的 驱动 程序 和 设施 文 持 procfs 文 件 系统 时 ， 该 目录 中 就 会 包含 更 多 的 文 
我 们 将 介绍 一 些 /proc 目 录 中 第 用 的 文件 ， 并 简单 讨论 它们 

用途。 

用 来 撰写 本 章 内 容 的 电脑 上 的 /proc 目 录 列 表 包 括 如 下 项 目 : 


在 多 数 情况 下 ， 只 需 直接 读 取 这 些 文件 就 可 以 获得 状态 信息 。 例 
如 ，/proc/cpuinfo 给 出 的 是 cpu 的 详细 信息 : 


$ cat fenton 


Genuinelinte 
15 
Intel (R P im $ CPU 2 


` 5 s ipic sep mtrr pge mca cmov pat 
fiush at acpi FED fxs 5 


类 类 似 地 ， /proc/meminfo 和 /proc/version 分 别 给 出 的 是 内 存 使 用 情况 
和 内 核 版 本 信息 : 


> cat /proc/meminfo 
Memfotal: 7615 


MemFree kB 
kB 

ne kR 
Ac kB 
HighFree kā 
wTot kB 
ONEY kB 
wapT kB 
wapF xB 
ir kB 
Anc KE 
Map kB 
+a kB 
Ske at kE 
SUnre im KB 
Page es kB 
NFS ab kB 
Bou kB 
55274 kB 

xB 

kB 

kB 

kB 

ks 


ae yaFoosse: TELS 
5 cat IPEDE ILUNA 
L x ion 4 2-2-default geeko@buildhost {gce version 4 


每 次 读 取 这 些 文件 的 内 容 时 ， 它们 所 提供 的 信息 都 会 及 时 更 新 。 所 
以 再 读 一 次 meminfo 文 件 会 给 出 最 新 的 信息 。 
你 可 以 通过 特定 内 核 函 数 获得 更 多 的 信息 ， 它 们 位 于 /proc 目 录 的 子 


目录 中 。 例 如 ， 你 可 以 通过 /proc/net/sockstat 文 件 获 得 网 络 套 接 字 的 使 用 
统计 : 


$ cat /proc/net/sockstat 


sockets: used 28 

TCP: inuse 4 orpha a Cc m 1 
UDP: use 

UDPLITE: inuse 

RAW nuse 

FRAG: inuse 0 memor 


/proc 目 录 中 的 有 些 条 目 不 仅 可 以 被 读 取 ， 而 且 可 以 被 修改 。 例 如 ， 
系统 中 所 有 运行 的 程序 同时 能 打开 的 文件 总 数 是 Linux 内 核 的 一 个 参 
数 。 它 的 当前 值 可 通过 读 取 /proc/sys/fs/file-max 文 件 得 到 : 
$ cat /proc/sys/fs/file-max 
76593 

这 个 值 被 设置 为 76593。 如 果 你 需要 增 大 该 值 ， 则 可 以 通过 写 同一 
个 文件 来 实现 。 如 果 你 正在 运行 一 个 需要 同时 打开 很 多 文件 的 应 用 程序 
A E EE E 


对 /proc 目 录 中 的 文件 进行 写 操作 需要 超级 用 户 的 权限 。 你 在 修 
改 数 据 时 需要 特别 小 心 ， 写 入 不 适当 的 值 可 能 会 引发 严重 的 问题 ， 
比如 系统 骨 浊 和 数据 丢失 。 


如 果 要 将 系统 范围 的 文件 句柄 限制 增加 为 80 000， 你 只 需 将 新 的 上 
限 值 写 入 file-max 文 件 即 可 : 

现在 ， 当 你 再 次 读 取 该 文件 时 ， 你 就 可 以 看 到 新 设 定 的 值 ; 
$ cat /proc/sys/fs/file-max 
80000 

/proc 目 录 中 以 数字 命名 的 子 目 录用 于 提供 正在 运行 的 程序 的 信息 。 
你 将 在 第 11 章 中 学 习 程 序 如 何以 进程 的 方式 执行 。 

现在 ， 你 只 需要 知道 每 个 进程 都 有 一 个 唯一 的 标识 符 : 一 个 在 1 一 
32000 的 数字 。ps 命 令 会 给 出 当前 正在 运行 进程 的 列表 。 例 如 ， 在 本 章 
正在 编写 的 时 候 : 


neil@susel03:~/BLP4e ter 


你 可 以 看 到 有 几 个 正在 运行 bash shell 的 终端 会 话 和 一 个 正在 运行 ftp 
程序 的 文件 传输 会 话 。 你 可 以 通过 查看 /proc 目 录 来 获得 更 多 关于 ftp 会 话 
的 细节 。 

ftp 的 进程 标识 符 是 9118， 所 以 你 需要 查看 /proc/9118 来 获得 关于 它 
WELAT: 


3 ls -1 /proc/9118 


你 可 以 看 到 各 种 特殊 文件 ， 它 们 可 以 告诉 你 该 进程 的 相关 信息 。 

从 上 面 的 输出 中 你 可 以 知道 程序 /usr/bin/pftp 正 在 运行 ， 它 的 当前 工 
作 目 录 是 /home/neil/BLP4e/chapter03。 通 过 查看 这 个 日 录 下 的 其 他 文 
件 ， 你 还 可 以 看 到 局 动 它 的 命令 行 以 及 和 它 的 shell 环 境 。cmdline 和 
environ 文 件 以 一 系列 null 终 止 的 字符 串 来 提供 这 些 信息 ， 所 以 你 在 查看 
它们 时 需要 小 心 。 我 们 将 在 第 4 章 对 Linux 环 境 进行 深入 讨论 。 


od -c /proc/9118/cmdline 


你 可 以 看 到 ftp 是 由 命令 行 ftp 192.168.0.12 启 动 的 。 
fd 子 目录 提供 该 进程 正在 使 用 的 打开 的 文件 描述 符 的 信息 。 这 个 信 
恩 在 确定 一 个 程序 同时 打开 了 多 少 文件 时 十 分 有 用 。 每 个 打开 的 描述 符 


都 有 对 应 的 一 个 条 目 ， 条 目 名 字 与 描述 符 的 数字 相 匹 配 。 在 本 例 中 ， 你 
可 以 看 到 ftp 如 我 们 所 预期 的 那样 打开 了 0、1、2 和 3 描述 符 。 它 们 分 别 是 
标准 输入 、 标 准 输出 和 标准 错误 描述 符 以 及 一 个 到 远程 服务 器 的 连接 。 
S ls /proc/9118/fd 

GC LL & 2 


3.11 高 级 主题 ， fcnt1 和 mmap 

本 节 我 们 将 讨论 的 主题 你 可 能 会 想 跳 过 ， 因 为 它们 很 少 会 被 用 到 。 
话 虽 如 此 ， 但 我 们 还 是 把 它 放 在 这 里 供 你 参考 ， 因 为 在 解决 一 些 环 手 问 
题 时 ， 它 们 可 以 提供 比较 简单 的 解决 方案 。 
3.11.1 fent1 系 统 调用 


fcnt1 系 统 调 用 对 底层 文件 描述 符 提 供 了 更 多 的 操纵 方法 。 


#include <fcntl.h> 


int fentl(int fildes, int cmd); 
int fentl(int fildes, int cmd, long arg); 


利用 fcnt1 系 统 调 用 ， 你 可 以 对 打开 的 文件 摘 述 符 执 行 各 种 操作 ， 包 
括 对 它们 进行 复制 、 获 取 和 设置 文件 描述 符 标 志 、 获 取 和 设置 文件 状态 
标志 ， 以 及 管理 建议 性 文件 锁 等 。 

对 不 同 操作 的 选择 是 通过 选取 命令 参数 cmd 不 同 的 值 来 实现 的 ， 其 
取 值 定义 在 头 文件 fcnt1.h 中 。 根 据 所 选择 命令 的 不 同 ， 系 统 调用 可 能 还 
需要 第 三 个 参数 arg。 

© fcntl (fildes, F_DUPFD, newfd): 这 个 调用 返回 一 个 新 的 文件 描 

述 符 ， 其 数值 等 于 或 大 于 整数 newfd。 新 文件 描述 符 是 描述 符 fildes 

的 一 个 副本 。 根 据 已 打开 文件 数目 和 newfd 值 的 情况 ， 它 的 效果 可 

能 和 系统 调用 dup (fildes) 完全 一 样 。 

O fcntl (fildes，F_GETFD): 这 个 调用 返回 在 fcnt1.h 头 文件 里 定义 

的 文件 描述 符 标 志 ， 其 中 包括 FD_CLOEXEC， 它 的 作用 是 决定 是 

否 在 成 功 调用 了 某 个 exec 系 列 的 系统 调用 之 后 关闭 该 文件 描述 符 。 

O fcntl (fildes, F_SETFD, flags): 这 个 调用 用 于 设置 文件 描述 符 标 

志 ， 通 常 仅 用 来 设置 FD_CLOEXEC。 

© fcntl (fildes, FLGETFL) 和 fcntl (fildes, F_SETFL, flags): 这 两 

个 调用 分 别 用 来 获取 和 设置 文件 状态 标志 和 访问 模式 。 你 可 以 利用 

在 fcnt1.h 头 文件 中 定义 的 掩 码 O0_ACCMODE 来 提取 出 文件 的 访问 模 

式 。 其 他 标志 包括 那些 当 open 调 用 使 用 O_CREAT 打 开 文 件 时 作为 

第 三 参数 出 现 的 标志 。 注 意 ， 你 不 能 设置 所 有 的 标志 ， 特 别 是 不 能 

通过 fcnt1 设 置 文件 的 权限 。 

你 还 可 以 通过 fcnt1 实 现 建议 性 文件 锁 。 详 细 信 息 请 参考 fcnt1 手 册页 


的 第 二 节 ， 或 者 阅读 本 书 的 第 7 章 ， 我 们 将 在 那里 讨论 文件 锁 。 


3.11.2 mmap žy 


UNIX 提 供 了 一 个 有 用 的 功能 以 允许 程序 共享 内 存 ，Linux 内 核 从 2.0 
版 本 开始 已 经 把 这 一 功能 包括 进来 。mmap (A TERR) 函数 的 作用 是 
建立 一 段 可 以 被 两 个 或 更 多 个 程序 读 写 的 内 存 。 一 个 程序 对 它 所 做 出 的 
修改 可 以 被 其 他 程序 看 见 。 

这 一 功能 还 可 以 用 在 文件 的 处 理 上 。 你 可 以 使 某 个 磁盘 文件 的 全 部 
内 容 看 起 来 就 像 是 内 存 中 的 一 个 数组 。 如 果 文 件 由 记录 组 成 ， 而 这 些 记 
录 又 能 够 用 C 语 言 中 的 结构 来 描述 的 话 ， 你 就 可 以 通过 访问 结构 数组 来 
更 新 文件 的 内 容 了 。 

这 要 通过 使 用 带 特殊 权限 集 的 虚拟 内 存 段 来 实现 。 对 这 类 虚拟 内 存 
段 的 读 写 会 使 操作 系统 去 读 写 磁盘 文件 中 与 之 对 应 的 部 分 。 

mmap 函 数 创建 一 个 指向 一 段 内 存 区 域 的 指针 ， 该 内 存 区 域 与 可 以 
通过 一 个 打开 的 文件 描述 符 访问 的 文件 的 内 容 相 关联 。 


#include <sys/mman.h> 


你 可 以 通过 传递 off 参 数 来 改变 经 共 译 内 存 段 访问 的 文件 中 数据 的 起 
始 偏 移 值 。 打 开 的 文件 描述 符 由 fldes 参 数 给 出 。 可 以 访问 的 数据 量 
《 即 内 存 段 的 长 度 ) 由 len 参 数 设 置 。 

你 可 以 通过 addr 参 数 来 请 求 使 用 茶 个 特定 的 内 存 地 址 。 如 果 它 的 取 
值 是 零 ， 结 果 指 针 就 将 自动 分 配 。 这 是 推荐 的 做 法 ， 否 则 会 降低 程序 的 
可 移植 性 ， 因 为 不 同系 统 上 的 可 用 地 址 范围 是 不 一 样 的 。 

prot 参 数 用 于 设置 内 存 段 的 访问 权限 。 它 是 下 列 常数 值 的 按 位 OR 结 


O PROT_READ: 人 允许 读 该 内 存 段 。 

O PROT_WRITE: 人 允许 写 该 内 存 段 。 

O PROT_EXEC: 允许 执行 该 内 存 段 。 

口 PROT_NONE: 该 内 存 段 不 能 被 访问 。 

flags 参 数控 制程 序 对 该 内 存 段 的 改变 所 造成 的 影响 ， 可 以 使 用 的 选 
项 如 表 3-7 所 示 。 


msync KHA VE ze: 把 在 该 内 存 段 的 茶 个 部 分 或 整 段 中 的 修改 写 
回 到 被 映射 的 文件 中 《或 者 从 被 映射 文件 里 读 出 ) 。 


#include <sys/mman.h> 


int msync(void *addr, size_t len, int flags); 
内 存 段 需 要 修改 的 部 分 由 作为 参数 传递 过 来 的 起 始 地 址 addr 和 长 度 
、， 定 。flags 参 数控 制 着 执行 修改 的 具体 方式 ， 可 以 使 用 的 选项 如 表 3- 
8 所 不 。 


表 3-8 


munmap 函 数 的 作用 是 释放 内 存 段 : 


#include <sys/mman.h> 


int munmap(void *addr, size_t len); 


下 面 的 程序 mmap.c 演 示 了 如 何 利 用 mmap 和 数组 方式 的 存 取 操作 来 
修改 一 个 结构 化 数据 文件 。 注 意 ，2.0 版 本 之 前 的 Linux 内 核 不 完全 支持 
mmap 的 这 种 用 法 。 这 个 程序 在 Sun Solaris 和 其 他 操作 系统 上 也 能 够 正确 


一 /一 
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X 验 使 用 mmap 函 数 


(1) 我 们 先 定 义 一 个 RECORD 数 据 结构 ， 然 后 创建 出 NRECORDS 
个 记录 ， 每 个 记录 中 保存 着 它们 各 自 的 编导 。 然 后 把 这 些 记 录 都 追加 到 
文件 records.dat 里 去 。 


or 
sv 


lose 


(2) 接着， 我 们 把 第 43 条 记录 中 的 整数 值 由 43 修 改 为 143， 并 把 它 
写 入 第 43 条 记录 中 的 字符 串 。 


*records.dat", "r 


> y : 
fseek (fp, 43*sizeof (record) , SEEK_SET) ; 
fread(&record, sizeof{record),1, fp); 
intege 
r, re g, "RECOR d" record. integer 
fp izeof d) , SEEX_SET 
i xd) ,1, fp 


(3) 现在 把 这 些 记 录 映 射 到 内 存 中 ， 然 后 访问 第 43 条 记录 ， 把 它 
人 
映射 的 方法 。 


r da DWR 
e ECORD *) mmap NR R eof (record 
T_READ | PROT. TE, MAP_SHAR 0 

ma 3 43; 

SI tf (mn 3 ing, "RECORD-%G" , mappe 3] ,int 

msyn v mapped, NRECK ecor MS_ASYN 

imap ( ( ) mappe NF eof (re d 
f 
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3.12 小 结 


在 本 章 中 ， 你 学 习 了 Linux 提 供 的 直接 访问 文件 和 设备 的 方法 。 你 
看 到 了 建立 在 这 些 诬 层 函数 之 上 的 库 函 数 是 如 何 为 程序 设计 问题 提供 有 灵 
活 的 解决 方案 的 。 现 在 ， 你 已 经 能 够 只 用 很 少 几 行 代码 就 编写 出 功能 相 
当 强 大 的 目录 扫描 例 程 了 。 

你 还 学 习 了 文件 和 目录 处 理 。 在 此 基础 之 上 ， 你 已 可 以 使 用 更 具 结 
构 化 的 、 基 于 文件 的 解决 方案 将 在 第 2 章 最 后 编写 的 初级 的 CD 唱片 应 用 
程序 转换 为 一 个 C 语 言 程 序 了 。 但 目前 你 还 无 法 给 这 个 程序 增加 新 的 功 
能 ， 所 以 对 整个 程序 的 重 写 工 作 将 推迟 到 你 学 习 了 如 何 处 理 屏 幕 显 示 和 
键盘 输入 之 后 再 进行 ， 而 这 些 内 容 正 是 接 下 来 两 章 的 主题 。 


PAR Linuxi 


NĪ? 

“4 为 Linux (或 UNIX 和 类 UNIX 系 统 ) 编写 程序 时 ， 你 必须 考虑 
到 程序 将 在 一 个 多 任务 环境 中 运行 。 这 意味 着 在 同一 时 间 会 有 多 个 程序 
运行 ， 它 们 共享 内 存 、 磁 盘 空 间 和 CPU 周期 等 机 器 资源 。 甚 至 同一 程序 
也 会 有 多 个 实例 同时 和 运行。 最 重要 的 是 ， 这 些 程序 能 够 互 不 和 干扰， 能够 
了 解 它们 的 环境 ， 并 且 能 正确 运行 ， 不 产生 冲突 (例如 ， 试 图 与 其 他 程 
序 同 时 写 同 一 个 文件 ) 。 

在 本 章 中 ， 我 们 将 介绍 程序 运行 的 环境 ， 程 序 如 何 通过 环境 来 获得 
有 关 其 运行 条 件 的 信息 ， 以 及 用 户 怎 样 改变 程序 的 行为 。 我 们 将 重点 介 
绍 以 下 内 容 : 
同 程 序 传递 参数 
口 环境 变量 
Oo 查看 时 间 
口 ”临时 文件 
O 
O 
O 


O 


获得 有 关 用 户 和 主机 的 信息 
生成 和 配置 日 志 信 息 
了 解 系统 各 项 资源 的 限制 


4.1 FEB? 


当 一 个 用 C 语 言 编写 的 Linux 或 UNIX 程 序 运行 时 ， 它 是 从 main 函 数 
开始 的 。 对 这 些 程序 而 言 ，main 函 数 的 声明 如 下 所 示 : 


int main(int argc, char *argv[]) 


其 中 argc 是 程序 参数 的 个 数 ，argv 是 一 个 代表 参数 自身 的 字符 串 数 组 。 
你 可 能 也 会 看 到 Linux 的 C 程 序 将 main 函 数 简单 的 声明 为 : 


malnl ) 


这 样 也 行 ， 因 为 默认 的 返回 值 类 型 是 int， 而 且 函 数 中 不 用 的 形式 参 
数 个 需要 声明 。 argc 和 argv 仍 在 ， 但 如 果 不 声 明 它 们 ， 你 就 不 能 使 用 它 


Al 1 3 

无 论 操 作 系 统 何 时 启动 一 个 新 程序 ， 参 数 argc 和 argv 都 被 设置 并 传 
递 给 main。 这 些 参数 通常 由 另 一 个 程序 提供 ， 这 个 程序 一 般 是 shell， 它 
要 求 操 作 系 统 局 动 该 新 程序 。shell 接 受用 户 输入 的 命令 行 ， 将 命令 行 分 
解 成 单词 ， 然 后 把 这 些 单 词 放 入 argv 数 组 。 请 记 住 : Linux 的 shell 一 般 会 
在 设置 argc 和 argv 之 前 对 文件 名 参数 进行 通配符 扩展 ， 而 MS-DOS 的 shell 
则 期 望 程序 接受 带 通 配 符 的 参数 ， 并 执行 它们 自己 的 通配符 扩展 。 

例如 ， 如 果 我 们 给 shell 输 入 如 下 命令 : 


$ myprog left right ‘and center' 
程序 myprog 将 从 main 函 数 开始 ，main 市 的 参数 是 : 


ay 
ALS 


注意 ， 参 数 个 数 包 括 程序 名 自身 ，argv 数 组 也 包含 程序 名 并 将 它 作 
为 第 一 个 元 素 argv[0]。 因 为 我 们 在 shell 命 令 里 使 用 了 引号 ， 所 以 第 四 个 
参数 是 一 个 包含 了 空格 的 字符 串 。 

如 果 你 用 ISO/ANSI C 语 言 编 写 过 程序 ， 束 会 对 上 面 的 这 些 很 熟悉 。 
main 的 参数 对 应 shell 脚 本 里 的 位 置 参数 $0、$1 等 。ISO/ANSIC 只 规定 
main 必 须 返 回 int， 而 X/Open 规范 则 早已 给 出 了 如 上 所 示 的 明确 声明 。 

命令 行 参数 在 向 程序 传递 信息 方面 是 很 有 用 的 。 例 如 ， 我 们 可 以 在 
一 个 数据 库 应 用 程序 中 使 用 命令 行 参数 来 传递 想 用 的 数据 库 的 名 字 ， 这 
样 就 可 以 在 多 个 数据 库 上 使 用 同一 个 程序 。 许 多 工具 程序 也 使 用 命令 行 
参数 来 改变 程序 的 行为 或 设置 选项 。 通 常 ， 你 可 以 使 用 一 个 以 短 横 线 


C 开头 的 命令 行 参数 来 设置 这 些 所 谓 的 标志 Cllag) 或 开关 
a ee E 
FHR) : 


S sort -r file 


命令 行 选项 很 常用 ， 因 此 按 相 同 的 方式 使 用 它们 对 程序 的 使 用 者 来 
说 是 很 有 好 处 的 。 过 去 ， 每 个 工具 程序 及 用 它们 各 自 的 方式 来 使 用 命令 
行 选项 ， 这 带 来 了 一 些 混乱 。 例 如 ， 请 看 下 面 这 些 命令 使 用 参数 的 方 


式 : 


$ tar cvfB /tmp/file.tar 1024 

$ dd if=/dev/fd0 of=/tmp/file.dd bs=18k 
$ aos --help 

$ ls -lstr 

$ ls -l -s -t -r 

我 们 建议 在 应 用 程序 中 ， 所 有 的 命令 行 开关 都 应 以 一 个 短 横 线 开 
头 ， 其 后 包含 单个 字母 或 数字 。 如 果 需 要 ， 不 市 后 续 参 数 的 选项 可 以 在 
一 个 短 横 线 后 归并 到 一 起 。 所 以 ， 上 面 的 两 个 K 命 令 示 例 束 遵循 了 以 上 
准则 。 如 采 某 个 选项 需要 值 ， 则 该 值 应 作为 独立 的 参数 紧 跟 在 该 选项 
后 。dd 命 令 示例 违背 了 这 一 准则 ， 因 为 它 使 用 了 多 字符 的 选项 ， 而 且 选 
项 未 以 短 横 线 开头 (if=/dev/fd0〉， 而 tar 命 令 则 把 选项 和 它们 的 值 完全 
分 开 ! 我 们 建议 最 好 能 为 单字 符 开 关 增 加 一 个 更 长 的 、 更 有 意义 的 开关 
名 ， 这 样 你 就 可 以 使 用 -h 或 --help 选 项 来 获得 帮助 了 。 

有 些 程序 还 有 一 个 奇怪 的 地 方 ， 就 是 用 选项 tx 举例 来 说 ) 执行 
与 -x 相反 的 功能 。 例 如 ， 在 第 2 划 中 ， 我 们 使 用 命令 set-oxtrace 来 设置 
shell 执 行 跟踪 ， 使 用 命令 setto xtrace 来 关闭 它 。 

撒 开 风格 各 异 的 语法 格式 不 谈 ， 单 是 记 住 所 有 这 些 程序 选项 的 顺序 
和 含义 就 已 经 非常 困难 了 。 通 常 ， 你 只 有 求助 于 -h (帮助) 选项 或 man 
手册 页 (如 果 程 序 员 提供 了 的 话 ) 。 你 将 在 本 章 稍 后 看 到 ，getopt 提 供 
了 对 这 些 问 题 的 一 个 优雅 的 解决 方案 。 不 过 现在 ， 我 们 还 是 先 看 看 传递 
到 程序 中 的 参数 是 怎样 处 理 的 。 


X 验 程序 参数 
下 面 这 个 程序 args.c 对 其 参数 进行 检查 : 


当 运 行 这 个 程序 时 ， 它 只 是 打印 其 参数 和 发 现 的 选项 。 我 们 的 意图 


是 ， 让 该 程序 接受 一 个 字符 串 参 数 和 一 个 由 -f 选 项 引入 的 可 选 的 文件 名 
参数 。 其 他 的 选项 也 可 以 被 定义 。 


实验 解析 

这 个 程序 利用 计数 参数 argc 建 立 一 个 循环 来 检查 所 有 的 程序 参数 。 
它 通 过 检查 站 字母 是 否 是 短 横 线 来 发 现 选项 。 

在 本 例 中 ， 如 果 打 算 文 持 -] 选 项 和 -r 选 项 ， 那 么 我 们 就 忽略 了 一 个 
事实 : -lr 选项 应 该 和 -] -r 一 样 处 理 。 

X/Open 规范 (可 以 在 http://opengroup.org/ 上 找到 ) 定义 了 命令 行 选 
项 的 标准 用 法 (工具 语法 指南 ) ， 同 时 定义 了 在 C 语 言 程序 中 提供 命令 
行 开 关 的 标准 编程 接口 : getopt% 


4.1.1 getopt 


为 了 帮助 我 们 遵循 这 些 准 则 ，Linux 提 供 了 getopt 函 数 ， 它 文 持 需要 
关联 值 和 不 需要 关联 值 的 选项 ， 而 且 简 单 易 用 。 


$ ./args -i -lr 'hi there' -f fred.c 


fyiiment 


argument tnere 


argument 


getopt AŽ KAEA TENY main ek argar ENAA REN He 

受 一 个 选项 指定 符 字 符 串 optstring， 该 字符 串 告 诉 getopt 哪 些 选项 可 用 ， 

以 及 它们 是 否 有 关联 值 。optstring 只 是 一 个 字符 列表 ， 每 个 字符 代表 一 

个 单字 符 选 项 。 如 果 一 个 字符 后 面 紧 跟 一 个 冒号 (:) ， 则 表明 该 选项 

有 一 个 关联 值 作为 下 一 个 参数 。bash 中 的 getopts 命 令 执行 类 似 的 功能 。 
例如 ， 我 们 可 以 用 下 面 的 调用 来 处 理 上 面 的 例子 : 


#include <unistd.h> 


int getopt(int argc, char *const argv[], const char *optstring); 
extern char *optarg; 
extern int optind, opterr, optopt; 


它 允 许 几 个 简单 的 选项 : -i、-1、-r 和 -f， 其 中 -f 选 项 后 要 紧 跟 一 个 
文件 名 参数 。 使 用 相同 的 参数 ， 但 以 不 同 的 顺序 来 调用 命令 将 改变 程序 
的 行为 。 你 可 以 在 本 章 的 下 一 个 实验 部 分 进行 尝试 。 

getopt 的 返回 值 是 argv 数 组 中 的 下 一 个 选项 字符 〈 如 果 有 的 话 ) 。 
循环 调用 getopt 束 可 以 依次 得 到 每 个 选项 。getopt 有 如 下 行为 。 

口 ”、 如 果 选 项 有 一 个 关联 值 ， 则 外 部 变量 optarg 指 问 这 个 值 。 

O 如 宋 选 项 处 理 完 毕 ，getopt 返 回 -1， 特 殊 参 数 -- 将 使 getopt 停 止 扫 

描 选 项 。 

O “如 果 遇 到 一 个 无 法 识别 的 选项 ，getopt 返 回 一 个 问号 (?) ， 并 

把 它 保 存 到 外 部 变量 optopt 中 。 

OD 如果 一 个 选项 要 求 有 一 个 关联 值 〈 例 如 例子 中 的 -f) ， 但 用 户 

并 未 提供 这 个 值 ，getopt 通 党 将 返回 一 个 问号 (?) 。 如 果 我 们 将 选 

项 字符 串 的 第 一 个 字符 设置 为 冒号 〈:) ， 那 么 getopt 将 在 用 户 未 提 

供 值 的 情况 下 返回 冒号 〈: ) 而 不 是 问号 〈?) 。 

外 部 变量 optind 被 设置 为 下 一 个 竺 处理 参数 的 索引 。getopt 利 用 它 来 
记录 自己 的 进度 。 程 序 很 少 需要 对 这 个 变量 进行 设置 。 当 所 有 选项 参数 
都 处 理 完毕 后 ，optind 将 指 同 argv 数 组 尾部 可 以 找到 其 余 参数 的 位 置 。 

有 些 版 本 的 getopt 会 在 第 一 个 非 选项 参数 处 停 下 来 ， 返 回 -1 并 设置 
optind 的 值 。 而 其 他 一 些 版 本 ， 如 Linux 提 供 的 版 本 ， 能 够 处 理 出 现在 程 
序 参数 中 任意 位 置 的 选项 。 注 意 ， 在 这 种 情况 下 ，getopt 实 际 上 重 写 了 
argv 数 组 ， 把 所 有 非 选 项 参数 都 集中 在 一 起 ， 从 argv[optind] 位 置 开 始 。 
对 GNU 版 本 的 getopt 而 言 ， 这 一 行为 是 由 环境 变量 POSIXLY_CORRECT 
控制 的 ， 如 果 它 被 设置 ，getopt 就 会 在 第 一 个 非 选项 参数 处 停 下 来 。 此 
外 ， 还 有 些 getopt 版 本 会 在 遇 到 未 知 选 项 时 打印 出 错 信息 。 注 意 ， 根 据 
POSIX 规 范 的 规定 ， 如 果 opterr 变 量 是 非 零 值 ，getopt 就 会 同 stderr 打 印 一 
条 出 错 信 息 。 


S 验 getopt ži ' 
在 这 个 实验 中 ， 你 将 在 程序 中 使 用 getopt 函 数 ， 并 将 新 程序 命名 为 


argopt.c: 


break; 


printf (*argument %s\n" argv [optind]) ; 


现在 ， 当 运行 这 个 程序 时 ， 你 将 发 现 所 有 命令 行 参数 都 被 自动 处 理 
了 : 


$ ./argopt -i -lr 'hi there' -f fred.c -q 


filename: fred.c 
unknown option: q 
argument: hi there 
> 7J 
实验 解析 


这 个 程序 循环 调用 getopt 对 选项 参数 进行 处 理 ， 直 到 处 理 完 毕 ， 此 
时 getopt 返 回 -1。 每 个 选项 〈 包 括 未 知 选 项 和 缺少 关联 值 的 选项 ) 都 有 
相应 的 处 理 动作 。 根 据 使 用 的 getopt 版 本 ， 你 看 到 的 输出 可 能 和 上 面 显 
示 的 略 有 不 同 ， 尤 其 是 出 错 信 息 部 分 ， 但 含义 都 是 明确 的 。 

当 所 有 选项 都 处 理 完 毕 后 ， 程 序 像 以 前 一 样 把 其 余 参 数 都 打印 出 
来 ， 但 这 次 是 从 optind 位 置 开始 。 


4.1.2 getopt long 


许多 Linux 应 用 程序 也 接受 比 我 们 在 前 面 例子 中 所 用 的 单字 符 选 项 
含义 更 明确 的 参数 。GNU C 函 数 库 包含 getopt 的 男 一 个 版 本 ， 称 作 


getopt_long， 它 接受 以 双 划 线 〈--) 开始 的 长 参数 。 


S 验 getopt_long 
你 可 以 使 用 getopt long 创建 一 个 新 版 本 的 示例 程序 ， 它 可 以 使 用 与 
前 面 选 项 等 效 的 长 参数 选项 : 


$ ./longopt --initialize --list ‘hi there' --file fred.c -q 


事实 上 ， 新 的 长 选项 和 原来 的 单字 符 选 项 可 以 混合 使 用 。 只 要 它们 
能 够 被 区 分 开 ， 长 选项 也 可 以 缩写 。 有 关联 值 的 长 选项 可 以 按照 格式 -- 
option=value 作 为 单个 参数 给 出 ， 如 下 所 示 : 


$ ./longopt --init -l --file=fred.c 'hi there' 
option: i 


option: 1 
filename: fred.c 


argument: hi th 


新 程序 longopt.c 如 下 所 示 ， 其 中 ， 以 阴影 显示 的 部 分 为 文 持 长 选项 
而 对 argopt.c 所 做 的 修改 : 

#include <stdio.h> 

#include <unistd.h> 


ptin < ar 


实验 解析 

getopt_long 函 数 比 getopt 多 两 个 参数 。 第 一 个 附加 参数 是 一 个 结构 
数组 ， 它 描述 了 每 个 长 选项 并 告诉 getopt_long 如 何 处 理 它们 。 第 二 个 附 
加 参数 是 一 个 变量 指针 ， 它 可 以 作为 optind 的 长 选项 版 本 使 用 。 对 于 每 
个 识别 的 长 选项 ， 它 在 长 选项 数组 中 的 索引 就 写 入 该 变量 。 在 本 例 中 ， 
你 不 需要 这 一 信息 ， 因 此 第 二 个 附加 参数 是 NULL。 

长 选项 数组 由 一 些 类 型 为 struct option 的 结构 组 成 ， 每 个 结构 描述 了 
一 个 长 选项 的 行为 。 该 数组 必须 以 一 个 包含 全 0 的 结构 结尾 。 

长 选项 结构 在 头 文件 getopth 中 定义 ， 并 且 该 头 文 件 必 须 与 常量 
_GNU_SOURCE 一 同 包 含 进 来 ， 该 常量 启用 getopt long 功能。 


struct eption 4 
const char *name; 
int has_arg; 
int *flag; 


int val; 


该 结构 的 成 员 如 表 4-1 所 示 。 
表 4-1 


选项 成 员 说 
we Ke. BIOS, ey 
KERLGTEM. ONLKEM. INGA TEM. LRT -THRSH 
RM ALLA RMA HIN. getopt tong MCE Avail MAMMA. FR. 
Jot of ns 返回 0， 并 将 val 的 值 写 入 fiaso 指 向 的 变 咯 
etopt long A AR TEE A 


要 了 解 GNU 对 getopt 扩 展 的 其 他 选项 及 相关 函数 ， 请 参考 getopt 的 手 


4.2 环境 变量 


我 们 在 第 2 章 讨论 过 环境 变量 。 这 是 一 些 能 用 来 控制 shell 脚 本 和 其 
他 程序 行为 的 变量 。 你 还 可 以 用 它们 来 配置 用 户 环境 。 例如， 每 个 用 户 
有 一 个 环境 变量 HOME， 它 定义 了 用 户 的 家 目录 ， 即 该 用 户 会 话 的 默认 
开始 位 置 。 正 如 你 已 看 到 的 ， 你 可 以 在 shell 提 示 符 中 检查 环境 变量 : 

$ echo $HOME 
/home/neil 


你 也 可 以 使 用 Shell 的 set 命 令 来 列 出 所 有 的 环境 变量 。 

UNIX 规 范 为 各 种 应 用 定义 了 许多 标准 环境 变量 ， 包 括 终 端 类 型 、 
默认 的 编辑 嚣 、 时 区 等 。C 语 言 程序 可 以 通过 putenv 和 getenv 函 数 来 访问 
环境 变量 。 


#include <stdlib.h> 


char *getenv(const char *name); 
int putenv(const char *string); 


环境 由 一 组 格式 为 “名 字 = 值 ”的 字符 串 组 成 。getenv 函 数 以 给 定 的 名 
字 搜 索 环 境 中 的 一 个 字符 串 ， 并 返回 与 该 名 字 相 关 的 值 。 如 果 请 求 的 变 
量 不 存在 ， 它 就 返回 null。 如 果 变 量 存 在 但 无 关联 值 ， 它 将 运行 成 功 并 
返回 一 个 空 字符 串 ， 即 该 字符 串 的 第 一 个 字 节 是 nul。 由 于 getenv 返 回 
的 字符 串 是 存储 在 getenv 提 供 的 静态 空间 中 ， 所 以 如 果 想 进一步 使 用 
Be 复制 到 男 一 个 字符 串 中 ， 以 免 它 被 后 续 的 getenv 调 用 
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putenv 函 数 以 一 个 格式 为 “名 字 = 值 ”的 字符 串 作 为 参数 ， 并 将 该 字符 
串 加 到 当前 环境 中 。 如 果 由 于 可 用 内 存 不 足 而 不 能 扩展 环境 ， 它 会 失败 
并 返回 -1。 此 时 ， 错 误 变 量 errno 将 被 设置 为 ENOMEM。 

在 下 面 的 实验 中 ， 你 将 编写 一 个 程序 来 打印 所 选 的 任意 环境 变量 的 
值 。 如 果 给 程序 传递 第 二 个 参数 ， 你 还 将 设置 环境 变量 的 值 。 


实 验 getenv 和 putenv 
(1) 紧 接 在 main 函 数 声 明 后 的 几 行 代码 用 于 确保 程序 environ.c 被 
正确 调用 ， 它 只 带 有 一 个 或 两 个 参数 : 


finclude <stdlib.h> 
include <stdio.h> 


(2) 然后 ， 调 用 getenv 从 环境 中 取出 变量 的 值 : 


#include <string.h> 
int maintint argc, char *argv[{]) 
char *var, *value; 

if(arge «= 1 || argc > 3) { 


fprintf(stderr, "usage: environ var [value]\n"); 
exit(1); 


(3) 接 下 来 ， 检 查 程序 调用 时 是 否 有 第 二 个 参数 。 如 果 有 ， 则 通 
过 构造 一 个 格式 为 “名 字 = 值 ”的 字符 串 并 调用 putenv 来 设置 变量 的 值 : 


var argv[i]; 
value = getenv(var) ; 


if (value) 

printf(*Variable ts has value s\n’, var, value); 
else 

printf ("Variable ts has no value\n", var); 


(4) 最 后 ， 再 次 调用 getenv 来 查看 变量 的 新 值 


if{arge == 3) { 
char *string;: 
value = argv[2}; 
string = malloc(strlen(var) +¢strlen(value) +2); 
if(istring) ( 
fprintf(stderr, "out of memory\n"); 
exit(l)}; 
} 
strcpy (string, var); 
streat (string, *=") 
streat (string, value) 
printf ("Calling purenv with: $%s\n", string} 
if(putenv(string) != 0) { 
fprintf(stderr, *putenv failed\n"); 
free(string); 
exit(l): 


运行 这 个 程序 ， 你 可 以 查看 和 修改 环境 变量 : 


printf{"New value of ts is ts\n", var, value); 
printf(*New value of ts is null??\n", var); 


exit (0); 
} 


$ ./environ FRED 

Variable FRED has no value 

$ ./environ FRED hello 

Variable FRED has no value 
Calling putenv with: FRED=hello 
New value of FRED is hello 

$ ./environ FRED 

Variable FRED has no value 


注意 : 环境 仅 对 程序 本 身 有 效 。 你 在 程序 里 做 的 改变 不 会 反映 


到 外 部 环境 中 ， 这 是 因为 变量 的 值 不 会 从 子 进 程 〈 你 的 程序 ) 传播 
到 父 进程 (shell) 。 


程序 经 常 使 用 环境 变量 来 改变 它们 的 工作 方式 。 用 户 可 以 通过 以 下 
方式 设置 环境 变量 的 值 : 在 默认 环境 中 设置 、 通 过 登录 shell 读 取 的 。 
profile 文 件 来 设置 、 使 用 shell 专 用 的 启动 文件 (rc) 或 在 shell 命 令 行 上 
对 变量 进行 设 定 。 例 如 : 

$ ./environ FRED 

Variable FRED has no value 
S FRED=hello ./environ FRED 
Variable FRED has value hello 

shell 将 行 首 的 变量 赋值 作为 对 环境 变量 的 临时 改变 。 在 上 面 的 第 二 
个 例子 中 ， 程 序 environ 将 运行 在 一 个 变量 FRED 有 一 个 赋值 的 环境 中 。 

举 个 例子 ， 在 CD 数据 库 应 用 程序 的 未 来 版 本 中 ， 你 可 以 通过 改变 
一 个 环境 变量 ， 比 如 CDDB， 来 指定 所 用 的 数据 库 。 这 样 ， 每 个 用 户 就 
能 指定 自己 的 默认 值 ， 或 者 在 每 次 运行 时 使 用 shell 命 令 来 设 定 : 

$ CDDB=mycds; export CDDB 
$ cdapp 


AY 


$ CDDB=mycds cdapp 


环境 变量 是 一 把 双 刃 人 环 ， 使 用 它 的 时 候 要 小 心 ! 与 命令 行 选项 
相 比 ， 它 们 对 用 户 来 说 更 加 “隐蔽 ”， 这 样 就 使 得 程序 的 调试 变 得 更 
加 困难 。 从 菏 种 意义 上 来 说 ， 环 境 变 量 束 像 全 局 变量 一 样 ， 它 们 会 
改变 程序 的 行为 ， 产 生 不 可 预期 的 结果 。 


4.2.2 environ’ = 
正如 你 已 看 到 的 ， 程 序 的 环境 由 一 组 格式 为 “名 字 = 值 > 的 字符 串 组 


成 。 程 序 可 以 通过 environ 变 量 直 接 访 问 这 个 字符 串 数 组 。environ 变 量 的 
声 明 如 下 所 示 : 


#include <stdlib.h> 


extern char **environ; 


X 验 environ 变 量 
下 面 这 个 程序 showenv.c 使 用 environ 变 量 打 印 环境 变量 : 


#include <stdlib.h> 
#include <stdio.h> 


extern char **environ; 


int main() 


当 在 Linux 系 统 中 运行 该 程序 时 ， 你 将 得 到 如 下 的 输出 〈 略 做 删 
减 ) 。 这 些 变量 的 数目 、 出 现 顺 序 和 值 取 决 于 操作 系统 的 版 本 、 所 用 的 
shell 以 及 程序 运行 时 的 用 户 设置 。 

$ ./showenv 
HOSTNAME=tilde.provider.com 


LOGNAME=neil 
MAIL=/var/spool/mail/neil 
TERM=xterm 

HOSTTYPE=i386 
PATH=/usr/local/bin:/bin: /usr/bin: 
HOME=/usr/neil 

LS_OPTIONS=-N --color=tty -T 0 
SHELL=/bin/bash 

OSTYPE=Linux 


实验 解析 
这 个 程序 壳 历 environ 变 量 〈 一 个 以 null 结 尾 的 字符 串 数组 ) ， 并 打 
印 出 整个 环境 。 


4.3 ”时 间 和 日 期 


通 第 能 确定 时 间 和 日 期 对 一 个 程序 来 说 是 非常 有 用 的 。 程 序 可 能 
望 记 录 筷 运行 的 时 间 ， 或 者 可 能 需要 在 茶 些 时 候 改 变 它 的 运行 方式 。 例 
如 ， 一 个 游戏 可 能 拒绝 在 工作 时 间 运 行 ， 或 者 一 个 定时 备份 程序 可 能 想 
等 到 每 天 的 次 晨 才 开始 一 个 目 动 备份 。 


所 有 的 UNIX 系 统 都 使 用 同一 个 时 间 和 日 期 的 起 点 : 格林 尼 治 
时 间 (GMT) 1970 年 1 月 1 日 午夜 (0 点 ) 。 这 是 “UNIX 纪 元 的 起 
点 ”，Linux 也 不 例外 。Linux 系 统 中 所 有 的 时 间 都 以 从 那 时 起 经 过 
的 秒 数 来 衡量 。 这 和 MS-DOS 处 理 时 间 的 方法 类 似 ， 只 是 MS-DOS 
纪元 始 于 1980 年 。 其 他 系统 使 用 其 他 的 纪元 起 始 时 间 。 


时 间 通 过 一 个 预定 义 的 类 型 time t 来 处 理 。 这 是 一 个 大 到 能 够 容纳 
以 秒 计 算 的 日 期 和 时 间 的 整数 类 型 。 在 Linux 系 统 中 ， 它 是 一 个 长 整 
型 ， 与 处 理 时 间 值 的 函数 一 起 定义 在 头 文件 time.h 中 。 


绝 不 要 想当然 地 以 为 ， 时 间 就 是 32 位 的 。 在 使 用 32 位 time _t 类 
型 的 UNIX 和 Linux 系 统 中 ， 时 间 将 在 2038 年 回 绕 。 到 那 时 ， 我 们 希 
望 系统 都 开始 使 用 大 于 32 位 的 time_t 类 型 。 随 着 最 近 64 位 处 理 器 进 
入 主流 处 理 器 市 场 ， 这 一 趋势 几乎 是 必然 的 。 


#include <time.h> 


time t time(time_t *tloc); 


你 可 以 通过 调用 time 函 数 得 到 撒 层 的 时 间 值 ， 它 返回 的 是 从 纪元 开 
始 至 今 的 秒 数 。 如 采 ttoc 不 是 一 个 空 指针 ，time 函 数 还 会 把 返回 值 写 入 
tloc 指 针 指向 的 位 置 。 


实 验 time pk 2 o 
下 面 这 个 简单 的 程序 envtime.c 演 示 了 了 time 函数 的 用 法 : 


int main 


运行 这 个 程序 ， 它 会 在 20 秒 时 间 内 每 两 秒 钟 打印 一 次 底层 的 时 间 


$ ./envtime 
The time is 1179643852 
The time is 1179643854 
The time is 1179643856 
The time is 1179643858 
The time is 1179643860 
The time is 1179643862 
The time is 1179643864 
The time is 1179643866 
The time is 1179643868 
The time is 1179643870 
实验 解析 
这 个 程序 用 一 个 空 指针 参数 调用 time 函 数 ， 返 回 以 秒 数 计算 的 时 间 
和 日 期 。 程 序 休眠 两 秒 后 再 重复 调用 time 函 数 ， 总 共 调 用 10 次 。 
以 从 1970 年 开始 计算 的 秒 数 来 表示 时 间 和 日 期 ， 对 测算 某 些 事情 持 
续 的 时 间 是 很 有 用 的 。 你 可 以 把 它 考 虑 为 简单 地 把 两 次 调用 time 得 到 的 
值 相 减 。 然 而 ISO/ANSIC 标 准 委员 会 经 过 审议 ， 并 没有 规定 用 time t% 
型 来 测量 任意 时 间 之 间 的 秒 数 ， 他 们 发 明了 一 个 函数 difftime， 访 函数 
用 来 计算 两 个 time_t 值 之 间 的 秒 数 并 以 double 类 型 返回 它 。 


#include <time.h> 


double difftime(time_t timel, time_t time2); 


difftime K Bit PAT EY Tl (EZ TA 2, H timel-time AE (FA 
扩 数 返回 。 对 Linux 来 说 ，time 函 数 的 返回 值 是 一 个 易于 处 理 的 秒 数 ， 


但 考虑 到 最 大 限度 的 可 移植 性 ， 你 最 好 使 用 difftime。 


为 了 提供 ‘对 人 类 ) 更 有 意义 的 时 间 和 日 期 ， 你 需要 把 时 间 值 转换 
为 可 读 的 时 间 和 日 期 。 有 一 de 
gmtime 函 数 把 确 层 时 间 值 分 解 为 一 个 结构 ， 结构 包含 一 些 常用 的 


成 员 : 


#include <time.h> 


struct tm *gmtime (const time_t timeval); 


结构 被 定义 为 至 少 包 含 表 4-2 所 示 的 成 员 。 
表 4-2 


tm_sec 的 范围 允许 临时 半 秒 或 双 周 秘 


SK 验 gmtimerk žr 
? Ma gmtime.c 利 用 tm 结构 和 gmtime 函 数 打 印 出 当前 时 间 和 


v ath 
| gmtime (& i 
r aw tine is $ A 
mtime gives 
"date 802d/% 
m ptr m_year pt tm_n A | 
R 2å: 
pt ur pt mi tm_p m_se 

x { ; 


运行 这 个 程序 ， 你 将 得 到 含义 明显 的 时 间 和 日 期 : 


~ 


Raw time is 1179644196 
gmtime gives 

date: 107 5/20 

time: 06:56:36 

Sun May 20 07:56:37 BST 2007 


实验 解析 

这 个 程序 调用 time 函 数 得 到 底层 的 时 间 值 ， 然 后 调用 gmtime 将 该 值 
转换 为 一 个 包含 有 用 的 时 间 和 日 期 值 的 结构 。 最 后 ， 程 序 用 printf 将 这 
些 信 息 打 印 出 来 。 严 格 来 说 ， 你 不 应 该 用 这 种 方法 打印 原始 时 间 值 ， 因 
为 我 们 并 不 能 保证 它 在 所 有 系统 上 都 是 long 类 型 的 值 。 我 们 在 运行 
gmtime 程 序 后 立即 运行 date 命 令 以 比较 它们 的 输出 。 

不 过 ， 这 儿 有 个 小 问题 。 如 果 在 格林 尼 治 标准 时 间 (GMT) 之 外 
的 时 区 运行 这 个 程序 ， 或 者 所 在 的 地 方 像 本 例 中 那样 采用 了 夏令 时 ， 你 
会 发 现时 间 (可 能 还 有 日 期 是 不 对 的 。 这 是 因为 gmtime 按 GMT 返 回 
时 间 〈 现 在 GMT 被 称 为 世界 标准 时 间 ， 或 UTC) 。Linux 和 UNIX 这 样 做 
是 为 了 同步 全 球 各 地 的 所 有 程序 和 系统 。 不 同时 区 同一 时 刻 创 建 的 文件 
都 会 有 相同 的 创建 时 间 。 要 看 当地 时 间 ， 你 需要 使 用 localtime 函 数 。 


#include <time.h> 


struct tm *localtime(const time t *timeval); 


localtime Ki 2 Algmtime—*, BR SCOR E HI Pea ORE 
当地 时 区 和 是 人 否 采用 夏令 时 做 了 调整 。 如 果 把 上 面 程序 中 的 gmtime 换 成 
localtime， 再 编译 运行 一 次 ， 你 束 会 看 到 正确 的 时 间 和 日 期 了 。 

要 把 已 分 解 出 来 的 tm 结构 再 转换 为 原始 的 time_t 时 间 值 ， 你 可 以 使 
用 mktime 函 数 : 


#include <time.h> 


time 七 mktime(struct tm *timeptr) ; 


如 果 tm 结 构 不 能 被 表示 为 time _t 值 ，mktime 将 返回 -1。 
为 了 得 到 更 “友好 ”的 时 间 和 日 期 表示 ， 像 date 命 令 输出 的 那样 ， 你 
HY LE H asctime ph 20 Fl ctime pk] 2X: 


#include <time.h> 


char *asctime(const struct tm *timeptr); 
char *ctime(const time_t *timeval); 


asctime 函 数 返 回 一 个 字符 串 ， 它 表示 由 tm 结构 timneptr 所 给 出 的 时 间 
和 日 期 。 这 个 返回 的 字符 串 有 类 似 下 面 的 格式 : 


Sun Jun 9 12:34:56 2007\n\0 


ERE ERE A267 7-45 WIE ERE TL. ctime PA BLE AL ed AR 
面 这 个 函数 : 


它 以 原始 时 间 值 为 参数 ， 并 将 它 转换 为 一 个 更 易 读 的 本 地 时 间 。 


SK 验 ctime pk žk 
TEA BI, EH BR EY RISK ES -A ctime ek UY HE: 


tir tim 


include <stdlib.h> 


编译 并 运行 这 个 ctime.c 程 序 ， 你 将 看 到 如 下 所 示 的 输出 : 
$ ./ctime 
The date is: Sat Jun 9 08:02:08 2007 

实验 解析 

ctime.c 程 序 调用 time 函 数 得 到 底层 时 间 值 ， 让 ctime 做 所 有 的 艰巨 工 
作 ， 把 时 间 值 转换 成 可 读 的 字符 串 ， 然 后 打印 它 。 

为 了 对 时 间 和 日 期 字符 串 的 格式 有 更 多 控制 ，Linux 和 现代 的 类 
UNIX 系 统 提 供 了 strftime 函 数 。 它 很 像 是 一 个 针对 时 间 和 日 期 的 sprintf 
函数 ， 工 作 方 式 也 很 类 似 : 

strftime 消 数 格式 化 timeptr 指 针 指 问 的 tm 结构 所 表示 的 时 间 和 日 期 ， 
并 将 结果 放 在 字符 串 s 中 。 字 符 串 被 指定 (人 至少 ) maxsize 个 字符 长 。 


format 字 符 串 用 于 控制 写 入 字符 串 s 的 字符 。 与 printf 一 样 ， 它 包 含 将 被 
a las 通 字 符 和 用 于 格式 化 时 间 和 日 期 元 素 的 转换 控制 符 。 转 
T 见 4-3。 


表 43 


因此 ，date 命 令 输 出 的 普通 日 期 束 相 当 于 strftime 格 式 字 符 串 中 的 : 


"$a tb Bd %H: 3M:%3S BY" 


为 了 读 取 日 期 ， 你 可 以 使 用 strptime 函 数 ， 该 函数 以 一 个 代表 日 期 
和 时 间 的 字符 串 为 参数 ， 并 创建 表示 同一 日 期 和 时 间 的 tm 结构 : 


char *strptime(const char *buf, const char *format, struct tm *timeptr); 


format 字 符 串 的 构建 方式 和 strftime 的 format 字 符 串 完全 一 样 。 
strptime fE F H FA fii A TRIA sscanf ee 3, 也 是 查找 可 识别 字段 ， 并 
把 它们 写 入 对 应 的 变量 中 。 只 是 这 里 是 根据 format 字 符 串 来 填充 tm 吉 构 
的 成 员 。 不 过 ， strptime 的 转换 控制 符 与 strftime 的 相 比 ， 限 制 要 稍微 松 
一 些 ， 因 为 strptime 中 的 星期 几 和 月 份 用 缩写 和 全 称 都 行 ， 两 者 都 瑟 配 
strptime 中 的 %a 控 制 符 ， 此 外 ，strftime 对 小 于 10 的 数字 总 以 0 开头 ， 而 
strptime 则 把 它 看 作 是 可 选 的 。 

strptime 返 回 一 个 指针 ， 指 回转 换 过 程 处 理 的 最 后 一 个 字符 后 面 的 
那个 字符 。 如 果 磁 到 不 能 转换 的 字符 ， 转 换 过 程 就 在 该 处 停 下 来 。 调 用 
程序 需要 检 碍 是 否 已 从 传递 的 字符 串 中 读 入 了 足够 多 的 数据 ， 以 确保 tm 
结构 中 写 入 了 有 意义 的 值 。 


X 验 strftime ef 2 All strptime 4 žr 


请 留意 下 面 这 个 程序 中 选用 的 转换 控制 符 : 


@inciude <stdio.h> 
} 


Sp. WLPS) i 


编译 并 运行 这 个 程序 strftime.c， 你 将 得 到 : 


> ./strftime 


ime giv gees x ent 6 A 3 
实验 解析 | 
strftime 程 序 通 过 调用 time 和 ]localtime 得 到 当前 的 本 地 时 间 。 然 后 ， 


它 通过 调用 带 有 合适 的 格式 参数 的 strftime 将 时 间 转 换 成 可 读 的 格式 。 为 
演示 strptime 的 用 法 ， 程 序 构 建 了 一 个 包含 日 期 和 时 间 的 字符 串 ， 然 后 
调用 strptime 将 原始 时 间 和 日 期 值 提取 并 打印 出 来 。 转 换 控 制 符 %R 是 
strptime 中 对 %H:%M 的 缩写 形式 。 

注意 : 要 成 功 地 扫描 日 期 ，strptime 需 要 一 个 准确 的 格式 字符 串 ， 
这 一 点 非常 重要 。 一 般 来 说 ， 访 函数 不 会 准确 扫描 读 自 用 户 的 日 期 ， 除 
非 用 户 输入 的 格式 非常 严格 。 

编译 strftime.c 时 ， 你 可 能 会 看 到 编译 器 有 一 个 警告 信息 。 这 是 因为 
GNU 库 在 默认 情况 下 并 未 声明 strptime 函 数 。 要 解决 这 个 问题 ， 你 需要 


J ri 2G 


明确 请 求 使 用 X/Open 的 标准 功能 ， 这 需要 在 包含 time.h 头 文件 之 前 加 上 
如 下 一 行 : 
#define XOPEN SOURCE 


4.4 临时 、 


很 多 情况 下 ， 程 序 会 利用 一 些 文件 形式 的 临时 存储 手段 。 这 些 临 时 
文件 可 能 保存 着 一 个 计算 的 中 间 结 果 ， 也 可 能 是 关键 操作 前 的 文件 备 
份 。 例 如 ， 一 个 数据 库 应 用 程序 在 删除 记录 时 就 可 能 使 用 临时 文件 。 该 
文件 收集 需要 保留 的 数据 库 条 目 ， 然 后 在 处 理 结束 后 ， 这 个 临时 文件 就 
变 成 新 的 数据 库 ， 原 来 文件 则 被 删除 。 

临时 文件 的 这 种 用 法 很 常见 ， 但 也 有 一 个 隐藏 的 缺点 。 你 必须 确保 
应 用 程序 为 临时 文件 选取 的 文件 名 是 唯一 的 。 人 否则 ， 因 为 Linux 是 一 个 
另 一 个 程序 就 可 能 选择 同样 的 文件 名 ， 从 而 导致 两 个 程序 
互相 干扰 。 

用 tmpnam 函 数 可 以 生成 一 个 唯一 的 文件 名 : 


#include <stdio.h> 


char *tmpnam(char *s); 


tmpnam 函 数 返 回 一 个 不 与 任何 已 存在 文件 同名 的 有 效 文 件 名 。 如 
果 字 符 串 S$ 不 为 宝 ， 文 件 名 也 会 号 入 它 。 对 tmpnam 的 后 续 调 用 会 履 盖 存 
放 返 回 值 的 静态 存储 区 ， 所 以 如 果 tmpnam 要 被 多 次 调用 ， 就 有 必要 给 
它 传递 一 个 字符 串 参 数 了 。 这 个 字符 串 的 长 度 至 少 要 有 L_tmpnam OM 
tH A20) 个 字符 。tmpnam 可 以 被 一 个 程序 最 多 调用 TMP_MAX 次 《至 少 
ALAR) ， 每 次 它 都 会 返回 一 个 不 同 的 文件 名 。 

如 果 遇 到 需要 立刻 使 用 临时 文件 的 情况 ， 你 可 以 用 tmpfile 函 数 在 给 
它 命名 的 同时 打开 它 。 这 点 非常 重要 ， 因 为 另 一 个 程序 可 能 会 创建 出 一 
A asec 同名 的 文件 。tmpfile 函 数 则 完全 避免 了 这 个 问 
题 的 发 生 : 


#include <stdio.h> 


FILE *tmpfile (void); 


tmpfile A ŽORE — LIFRE, Et AET SCF. 1% 
文件 以 读 写 方式 打开 (通过 w+ 方式 的 fopen) , SIFE WA S| HEK 
关闭 时 ， 访 文件 会 被 自动 删除 。 

如 果 出 错 ，tmpfile 返 回 空 指针 并 设置 errno 的 值 。 


S 4s; tmpnam 和 tmpfile 
让 我 们 来 看 看 这 两 个 函数 的 用 法 : 


Hf 
ptre 


编译 并 运行 程序 tmpnam.c， 你 可 以 看 到 tmpnam 生 成 的 唯一 文件 


$ ./tmpnam 
Temporary file name is: /tmp/file2S64zc 

实验 解析 

这 个 程序 调用 tmpnam 为 临时 文件 生成 一 个 唯一 的 文件 名 。 如 果 要 
用 它 ， 你 必须 尽 可 能 快 地 打开 它 以 减 小 男 一 个 程序 用 同样 的 名 字 打 开 文 
件 的 风险 。tmpfile 调 用 同时 创建 和 打开 一 个 临时 文件 ， 这 样 就 避免 了 这 
一 风险 。 事 实 上 ， 当 编译 一 个 使 用 mpnam 函 数 的 程序 时 ，GNU C 编 译 
虱 会 对 它 的 使 用 给 出 警告 信息 。 

UNIX 有 另 一 种 生成 临时 文件 名 的 方式 ， 就 是 使 用 mktemp 和 
mkstemp 了 水 数 。Linux 也 文 持 这 两 个 函数 ， 它 们 与 tmpnam 类 似 ， 不 同 之 
处 在 于 可 以 为 临时 文件 名 指定 一 个 模板 ， 模 板 可 以 让 你 对 文件 的 存放 位 
置 和 名 字 有 更 多 的 控制 : 


#include <stdlib.h> 


char *mktemp(char *template) ; 
int mkstemp (char *template) ; 


mktemp 函 数 以 给 定 的 模板 为 基础 创建 一 个 唯一 的 文件 名 。template 
参数 必须 是 一 个 以 6 个 X 字 符 结尾 的 字符 串 。mktemp 函 数 用 有 效 文件 名 
字符 的 一 个 唯一 组 合 来 丛 换 这 些 X 字 符 。 它 返回 一 个 指向 生成 的 字符 串 


的 指针 ， 如 果 不 能 生成 一 个 唯一 的 名 字 ， 它 就 返回 一 个 空 指 针 。 

mkstemp 函 数 类 似 于 tmpfile， 它 也 是 同时 创建 并 打开 一 个 临时 文 
件 。 文 件 名 的 生成 方法 和 mktemp 一 样 ， 但 是 它 的 返回 值 是 一 个 打开 
的 、 底 层 的 文件 描述 符 。 


你 应 该 在 程序 中 使 用 “创建 并 打开 ”函数 tmpfile 和 mkstemp， 而 
不 要 使 用 tmpnam 和 mktemp。 


4.5 445 Fe 


除了 著名 的 init 程 序 以 外 ， 所 有 的 Linux 程 序 都 是 由 其 他 程序 或 用 户 
启动 的 。 你 将 在 第 11 章 中 对 运行 中 的 程序 或 进程 的 交互 进行 更 深入 的 学 
习 。 用 户 通 常 是 在 一 个 啊 应 他 们 命令 的 shell 中 启动 程序 。 你 已 经 看 到 ， 
程序 能 够 通过 检查 环境 变量 和 读 取 系统 时 钟 来 在 很 大 程度 上 了 解 它 所 处 
的 运行 环境 。 程 序 也 能 够 发 现 它 的 使 用 者 的 相关 信息 。 

当 一 个 用 户 要 登录 进 Linux 系 统 时 ， 他 有 一 个 用 户 名 和 密码。 一 旦 
用 户 名 和 密码 通过 验证 ， 用 户 就 可 以 进入 一 个 shell。 从 内 部 机 制 来 说 ， 
用 户 还 有 一 个 唯一 的 用 户 标 识 符 UID 。Linux 运 行 的 每 个 程序 实际 上 都 是 
以 某 个 用 户 的 名 义 在 运行 ， 因 此 都 有 一 个 关联 的 UID。 

你 可 以 对 程序 进行 设置 ， 让 它们 的 运行 看 上 去 好 像 是 由 另 一 个 用 户 
启动 的 。 当 一 个 程序 的 SUID 位 被 置 位 时 ， 它 的 运行 束 好 像 是 由 该 可 执 
行文 件 的 属 主 启动 的 。 当 su 命令 被 执行 时 ， 程 序 的 运行 就 好 像 它 是 由 超 
级 用 户 启动 的 ， 它 随后 验证 用 户 的 访问 权限 ， 将 UID 改 为 目标 账户 的 
UID 值 并 执行 该 账户 的 登录 shell。 采 用 这 种 方式 还 可 以 允许 一 个 程序 的 
运行 就 好 像 是 由 男 一 个 用 户 启 动 的 ， 它 经 党 被 系统 管理 员 用 来 执行 一 些 
维护 任务 。 

既然 UID 是 用 户 喘 份 的 关键 ,我 们 束 从 它 开 始 吧 。 

UD Č H CAK uid t， 它 定义 在 头 文件 sys/types.h 中 。 它 
通常 是 一 个 小 整数 。 有 些 UID 是 系统 预定 义 的 ， 其 他 的 则 是 系统 管理 员 
在 添加 新 用 户 时 创建 的 。 一 般 情 况 下 ， 用 户 的 UID 值 都 大 于 100。 


#include <sys/types.h> 
#include <unistd.h> 


uid t getuid(void); 
char *getlogin(void); 


getuid 函 数 返 回程 序 关 联 的 UID， 它 通常 是 启动 程序 的 用 户 的 UID。 

getlogin 函 数 返 回 与 当前 用 户 关 联 的 登录 名 。 

系统 文件 /etc/passwd 包 含 一 个 用 户 账 号 数据 库 。 它 由 行 组 成 ， 每 行 
对 应 一 个 用 户 ， 包 括 用 户 名 、 加 密 口令 、 用 户 标识 符 CUID) 、 组 标识 
符 (GID) 、 全 名 、 家 日 录 和 默认 shell。 下 面 是 一 个 示例 行 : 


A on — pa pe Pa ~ ® 3 + Ataf s me nm 站 > atn j hac 
neil :zBaxfqedfpk:5 0:Neil Matthew: ome /neil:/bin/bash 


如 果 编 写 一 个 程序 ， 它 能 确定 启动 它 的 用 户 的 UID， 那 么 你 就 可 以 
对 它 进 行 扩 展 ， 让 它 查 找 密码 文件 以 找到 用 户 的 登录 名 和 全 名 。 但 我 们 
并 不 推荐 这 种 做 法 ， 因 为 为 了 提高 系统 的 安全 性 ， 现 代 的 类 UNIX 系 统 
都 不 再 使 用 简单 的 密码 文件 了 。 许 多 系统 ， 包 括 Linux， 都 有 一 个 使 用 
shadow 密 码 文 件 的 选项 ， 原 来 的 密码 文件 中 不 再 包含 任何 有 用 的 加 密 口 
令 信 息 〈 这 些 信 息 通 常 存放 在 /etc/shadow 文 件 中 ， 
这 是 一 个 普通 用 户 不 能 读 取 的 文件 ) 。 为 此 ， 人 们 定义 了 一 组 函数 来 提 
供 一 个 标准 而 又 有 效 的 获取 用 户 信息 的 编程 接口 : 


#include <sys/types.h> 
#include <pwd.h> 


struct passwd *getpwuid(uid t uid); 
struct passwd *getpwnam(const char *name); 


密码 数据 库 结 构 passwd 定 义 在 头 文件 pwd.h 中 ， 它 包含 表 4-4 中 的 成 


pi 


Re shell 


有 些 UNIX 系 统 可 能 对 用 户 全 名 字段 使 用 一 个 不 同 的 名 字 。 在 某 些 
系统 〈 如 Linux) 上 ， 它 是 pw_gecos， 而 在 其 他 系统 上 ， 它 是 
pw_comment。 这 就 意味 着 ， 我 们 不 能 对 它 给 出 一 个 统一 的 用 法 。 

getpwuid 和 getpwnam 函 数 都 返回 一 个 指针 ， 该 指针 指 回 与 某 个 用 户 
对 应 的 passwd 结 构 。 这 个 用 户 通 过 getpwuid 的 UID 参 数 或 通过 getpwnam 
的 用 户 登 录 名 参数 来 确定 。 出 错时 ， 它 们 都 返回 一 个 空 指 针 并 设置 


errno o 


实 验 用 户 信息 
下 面 的 程序 user.c 从 密码 数据 库 中 提取 出 一 些 用 户 信息 : 


它 给 出 如 下 的 输出 ， 在 不 同 的 Linux 和 UNIX 版 本 中 ， 输 出 结果 可 能 
BIA AF: 


name=nel. 


实验 解析 

这 个 程序 先 调用 getuid 获 得 当前 用 户 的 UID， 再 把 这 个 UID 用 在 
getpwuid 函 数 中 来 获得 密码 文件 中 保存 的 详细 人 信息。 此外， 我 们 还 演示 
了 通过 在 getpwnam 中 给 出 用 户 名 root 来 获得 用 户 信 息 的 方法 。 


如 果 查 看 Linux 的 源 代码 ， 你 就 能 在 id 命 令 的 源 代码 中 看 到 为 一 
个 使 用 getuid 函 数 的 例子 。 


如 果 要 扫描 密码 文件 中 的 所 有 信息 ， 你 可 以 使 用 getpwent 函 数 。 它 
的 作用 是 依次 取出 文件 数据 项 : 


#include <pwd.h> 
#include <sys/types.h> 


void endpwent (void); 
struct passwd *getpwent (void); 
void setpwent (void); 


getpwent K AUK MOKA ABP Be. RITA SCHR ERY, 
它 返 回 一 个 空 指针 。 如 果 已 经 扫描 了 足够 多 的 数据 项 ， 你 可 以 使 用 
endpwent 函 数 来 终止 处 理 过 程 。setpwent 函 数 重 置 读 指针 到 密码 文件 的 
开始 位 置 ， 这 样 下 一 个 getpwent 调 用 将 重新 开始 一 个 新 的 扫描 。 这 些 函 
数 的 操作 方式 与 我 们 在 第 3 章 讨 论 的 目录 扫描 函数 opendir、readdir 和 
closedir 非 常 相 似 。 
《有效 的 和 实际 的 ) 用 户 和 组 标识 符 还 可 以 被 其 他 一 些 不 太 常 用 的 

函数 获得 : 

#include <sys/types.h> 

#include <unistd.h> 


uid t geteuid(void); 


gid t getgid(void); 
gid t getegid(void); 
int setuid(uid_t uid); 
int setgid(gid_t gid); 


组 标识 符 和 有 效用 户 标识 符 的 详细 资料 请 参考 系统 的 手册 页 ， 虽 然 
你 可 能 会 发 现 目 己 根本 不 需要 对 它们 进行 处 理 。 


只 有 超级 用 户 才能 调用 setuid 和 setgid 函 数 。 


X a 


4.6 = A 


正如 程序 可 以 香 找 用 己 信息 居 一 样 ， 程 序 也 可 以 获得 运行 它 的 计算 机 
的 有 关 细 节 。uname 命 令 台 提供 这 类 信息 。 我 们 还 可 以 通过 同名 的 系统 
调用 在 C 语 言 程序 中 提供 同样 的 信息 一 一 请 使 用 man 2 uname 命 令 在 手册 
页 的 系统 调用 部 分 (第 2 部 分 ) 查找 它 的 用 法 。 

主机 信息 在 许多 情况 下 都 是 很 有 用 的 。 你 可 能 希望 根据 程序 运行 的 
机 右 在 网 络 上 的 名 学 来 定制 程序 的 行为 ， 比如 说 ， 这 人 台 机 器 是 学 生 用 的 
还 是 管理 员 用 的 。 从 许可 证 的 角度 考虑 ， 你 可 能 布 望 限制 程序 只 能 = 
台 机 器 上 运行 。 所 有 这 些 都 意味 着 你 需要 pli 法 来 确定 程序 运行 在 哪 
台 机 器 上 。 

如 果 系 统 安装 了 网 络 组 件 ， 你 可 以 通过 gethostname 函 数 很 容易 地 获 
取 它 的 网 络 名 : 


#include <unistd.h> 


int gethostname(char *name, size_t namelen); 


gethostname 消 数 把 机 器 的 网 络 名 写 入 name 了 字符 is 。 该 字符 串 至 少 
有 namelen 个 字符 长 。 成 功 时 ，gethostbyname 返 回 0， 人 否则 返 I L 
你 可 以 通过 uname 系 统 调用 获得 关于 主机 的 更 多 详细 信息 忆 


#include <sys/utsname.h> 


int uname (struct utsname *name) ; 


uname 函 数 把 主机 信息 写 入 name 参 数 指向 的 结构 。utsname 结 构 定 义 
在 头 文件 sys/utsname.h 中 ， 它 至 少 包 含 表 4-5 所 示 的 成 员 。 


表 45 


utename f Mi ig 3f 


weit R 


uname 在 成 功 时 返回 一 个 非 负 整 数 ， 否 则 返回 -1 并 设置 errno 来 
指出 错误 。 


实 验 主机 信息 
DO BAe Fe Ay HEENA: 


它 给 出 如 下 所 示 的 Linux 特 有 的 输出 。 如 果 你 的 机 器 联网 了 ， 你 可 
能 会 看 到 一 个 包含 网 络 名 在 内 的 扩展 主机 名 。 


/hostget 


实验 解析 

这 个 程序 调用 gethostname 来 获得 主机 的 网 络 名 。 在 上 面 的 例子 中 ， 
它 获 得 名 字 susel03。 有 关 这 人 台 基 于 Intel Pentium-4 的 Linux 计 算 机 的 更 多 
信息 通过 uname 调 用 返回 。 注 意 ，uname 返 回 的 字符 串 的 格式 是 与 具体 
实现 相关 的 ， 在 本 例 中 ， 版 本 字符 串 包含 内 核 编译 的 日 期 。 


使 用 uname 函 数 的 男 外 一 个 例子 请 参看 name 命 令 的 Linux 源 代 
码 。 


每 台 主 机 的 唯一 标识 符 可 以 通过 gethostid 函 数 获 得 : 


#include <unistd.h> 


long gethostid(void); 
gethostid 函 数 返 回 与 主机 对 应 的 一 个 唯一 值 。 许 可 证 管理 者 利用 它 


来 确保 软件 程序 只 能 在 拥有 合法 许可 证 的 机 器 上 运行 。 在 Sun 工 作 站 
上 ， 该 函数 返回 计算 机 生产 时 设置 在 非 易 失 性 存储 融 中 的 一 个 数字 ， 它 
对 系统 硬件 来 说 是 唯一 的 。 其 他 系统 ， 如 Linux， 返 回 一 个 基于 该 机 器 
因特网 地 址 的 值 ， 但 这 对 许可 证 管理 来 说 还 不 够 安全 。 


许多 应 用 程序 需要 记录 它们 的 活动 。 系 统 程序 经 常 需要 问 控 制 台 或 
日 志文 件 写 消息 。 这 些 消 息 可 能 指示 错误 、 警 告 或 是 与 系统 状态 有 关 的 
一 般 信 息 。 例 如 ，su 程 序 会 把 某 个 用 户 尝 试 得 到 超级 用 户 权 限 但 失败 的 
事实 记录 下 来 。 

通常 这 些 日 志 信息 被 记录 在 系统 文件 中 ， 而 这 些 系 统 文 件 又 被 保存 
在 专用 于 此 目的 的 目录 中 。 它 可 能 是 /usr/adm 或 /Var/log 目 录 。 对 一 个 典 
型 的 Linux 安 装 来 说 ， 文 件 /var/log/messages 包 含 所 有 系统 信 
妃 ，/varvlog/mail 包 含 来 和 目 邮 件 系 统 的 其 他 日 志 信 息 ，/vavlog/debug 可 能 

含 调试 信息 。 根 据 你 所 使 用 Linux 版 本 的 不 同 ， 可 以 通过 查 

看 /etc/syslog.conf 文 件 或 者 /etc/syslog-ng/sys-log-ng.conf 文 件 来 检查 系统 
配置 


下 面 是 一 些 日 志 信息 的 示例 : 


may < 


， 你 可 以 看 到 记录 的 各 种类 型 的 信息 ， 前 几 个 是 由 Linux 内 核 
在 启动 和 答 测 已 安装 硬件 时 自己 报告 的 信息 。 然 后 是 防火 墙 记录 它 重 新 
配置 的 信息 。 最 后 ， su 程序 报告 用 户 neil 获 得 了 超级 用 户 权限 。 


查看 日 志 信息 可 能 需要 有 超级 用 户 特权 。 


有 些 UNIX 系 统 并 不 像 上 面 这 样 提 供 可 读 的 日 志文 件 ， 而 是 为 管理 
员 提供 一 些 工 具 来 读 取 系 统 事件 的 数据 库 。 有 具体 情况 请 参考 系统 文档 。 
虽然 系统 消息 ee 式 不 尽 相 同 ， 但 产生 消息 的 方法 却 是 
UNIX 规 范 通 过 syslog 函 数 为 所 有 程序 产生 日 志 信 息 提 供 了 一 个 
口 : 


#include <syslog.h> 


void syslog(int priority, const char *message, arguments...); 


syslog Pa AIH] AAA A UH (facility) 发 送 条 日 志 信 息 。 每 条 


信息 都 有 一 个 priority 参 数 ， 该 参数 是 一 个 严重 级 别 与 一 个 设施 值 的 按 位 

或 。 严 重 级 别 控制 日 志 信 息 的 处 理 方 式 ， 设 施 值 记录 日 志 信息 的 来 源 。 
定义 在 头 文件 syslog.h 中 的 设施 值 包括 LOG_USER 〈 默 认 值 ) 

它 指 出 消息 来 自 一 个 用 户 应 用 程序 ， 以 及 LOG_LOCAL0、 

LOG_LOCAL1 直 到 LOG_LOCAL7， 它 们 的 含义 由 本 地 管理 员 指 定 。 
严重 级 别 按 优先 级 递减 排列 ， 如 表 4-6 所 示 。 


R 先 级 说 (2il 


oy AS 
KIAS 


ww 


根据 系统 配置 ，LOG_EMERG 信 息 可 能 会 广播 给 所 有 用 户 ， 
LOG_ALERT 信 息 可 能 会 EMAI 给 管理 员 ，LOG_DEBUG 信 息 可 能 会 被 
忽略 ， 而 其 他 信息 则 写 入 日 志文 件 。 当 编写 的 程序 需要 使 用 日 志 记录 功 
能 时 ， 你 只 需要 在 希望 创建 日 志 信 息 时 调用 syslog 函 数 即 可 。 

syslog 创 建 的 日 志 信 息 包 含 消 息 头 和 消息 体 。 消 息 头 根据 设施 值 及 
日 期 和 时 间 创 建 。 消 息 体 根据 syslog 的 message 参 数 创 建 ， 该 参数 的 作用 
类 似 printf 中 的 格式 字符 串 。syslog 的 其 他 参数 要 根据 message 字 符 串 中 
printf 风 格 的 转换 控制 符 而 定 。 此 外 ， 转 换 控制 符 %m 可 用 于 插入 与 错误 
变量 ermo 当 前 值 对 应 的 出 错 消息 字符 串 。 这 对 于 记录 错误 消息 很 有 用 。 


实 验 syslog% 
在 这 个 程序 中 ， 你 试图 打开 一 个 不 存在 的 文件 : 


rslog.h 


编译 并 运行 这 个 程序 syslog.c， 你 没有 看 到 输出 ， 但 
是 /var/log/messages 文 件 尾 现在 有 如 下 一 行 : 


Jun 9 09:24:50 susel 


实验 解析 

在 这 个 程序 中 ， 你 试图 打开 一 个 不 存在 的 文件 。 在 文件 打开 失败 
后 ， 调用 syslog 在 系统 日 志 中 记录 这 一 事件 。 

注意 : 日 志 信 息 并 未 指明 是 哪个 程序 调用 了 日 志 设 施 ， 它 仅仅 记录 
syslog 被 调用 以 记录 一 条 信息 的 事实 。%m 转 换 控 制 符 被 蔡 换 为 一 个 错 
eS ga ia 文件 没有 找到 ”。 这 比 仅 仅 报 告 一 个 原始 的 错误 

在 头 文件 syslog.h 中 还 定义 了 一 些 能 够 改变 日 志 记 录 行 为 的 其 他 函 
数 。 它 们 是 : 


#include <syslog.h> 


void closelog (void); 
void openlog(const char *ident, int logopt, int facility); 
int setlogmask(int maskpri); 


你 可 以 通过 调用 openlog 函 数 来 改变 日 志 信 息 的 表示 方式 。 它 可 以 
设置 一 个 字符 串 ident， SREB BINT 日 志 信 息 的 前 面 。 你 可 以 通过 
它 来 指明 是 哪个 程序 创建 了 这 条 信息 。facility 参 数 记 录 一 个 将 被 用 于 后 
A a 
续 syslog 调 用 的 行为 进行 配置 ， 它 是 0 个 或 多 个 表 4-7 中 参数 的 按 位 或 。 


K 4-7 


legopt 参 数 


不 是 等 到 第 


openlog rk 24> APACHE TY IPP SCP ANID A 并 通过 它 来 写 日 志 。 
你 可 以 调用 closelog 函 数 来 关闭 它 。 注 意 ， 在 调用 syslog 之 前 无 需 调 用 
openlog， 因 为 syslog 会 根据 需要 自行 打开 日 志 设 施 。 

你 可 以 使 用 setlogmask 函 数 来 设置 一 个 日 志 掩 码 ， 并 通过 它 来 控制 
日 志 信息 的 优先 级 优先 级 未 在 日 志 扼 码 中 置 位 的 后 syslog Val H Ab 
fo uae 过 这 个 方法 关闭 LOG_DEBUG 消 息 而 不 用 改变 程 
PEK. 

你 可 以 用 LOG_MASK (priority) 为 日 志 信息 创建 一 个 掩 码 ， 它 的 
作用 是 创建 一 个 只 包含 一 个 优先 级 的 掩 码 。 你 还 可 以 用 
LOG_UPTO (priority) 来 创建 一 个 由 指定 优先 级 之 上 的 所 有 优先 级 〈 包 
括 指定 优先 级 ) 构成 的 撼 码 。 


实 Us; logmask 程 序 
在 本 例 中 ， 你 将 看 到 日 志 掩 码 的 作用 : 


这 个 logmask.c 程 序 没 有 输出 ， 但 是 在 一 个 典型 的 Linux 系 统 中 ， 
在 /var/log/messages 文 件 尾 ， 你 会 看 到 如 下 信息 : 


接收 调试 日 志 信 息 的 文件 (根据 日 志 配 置 而 定 ， 通 常 
是 /var/log/debug， 有 了 时 也 可 能 是 /var/log/messages) 会 包含 如 下 信息 : 


实验 解析 

这 个 程序 用 它 自己 的 名 字 logmask 初 始 化 日 志 设 施 ， 并 要 求 日 志 信 
息 中 包含 进程 标识 符 。 一 般 信息 记录 到 文件 /varlog/messages 中 ， 调 试 信 
息 记 录 到 文件 /var/log/debug 中 。 第 二 条 调试 信息 没有 出 现 ， 这 是 因为 你 
调用 setlogmask 忽 略 了 优先 级 低 于 LOG_NOTICE 的 所 有 信息 (注意 ， 这 
种 做 法 在 早期 Linux 内 核 中 可 能 不 文 持 ) 。 

如 果 你 的 Linux 安 装 没 有 启用 调试 信息 日 志 记 录 功 能 ， 或 者 采用 的 
是 其 他 配置 情况 ， 你 可 能 看 不 到 调试 信息 。 要 局 用 所 有 的 调试 信息 ， 请 
查看 系统 中 针对 syslog 或 syslog-ng 的 文档 以 找到 正确 的 配置 方法 。 

logmask.c 还 用 到 了 getpid 函 数 ， 它 和 与 其 紧密 相关 的 getppid 函 数 的 
定义 如 下 上 所 示 : 


#include <sys/types.h> 
#include <unistd.h> 


pid_t getpid(void); 
pid_t getppid(void); 

这 两 个 函数 分 别 返 回调 用 进程 和 调用 进程 的 父 进程 的 进程 标识 符 
(PID) 。 要 了 解 PID 的 更 多 内 容 ， 请 参考 第 11 章 的 内 容 。 


48 Wi A PR HI 


Linux 系 统 上 运行 的 程序 会 受到 资源 限制 的 影响 。 它 们 可 能 是 硬件 
方面 的 物理 性 限制 (例如 内 存 ) 、 系 统 策 略 的 限制 〈 例 如 ， 人 允许 使 用 的 
CPU 时 间 ) 或 具体 实现 的 限制 《如 束 数 的 长 度 或 文件 名 中 所 人 允许 的 最 大 
字符 数 ) 。UNIX 规 范 定义 了 一 些 可 由 应 用 程序 决定 的 限制 。 第 7 章 对 限 
制 及 突破 限制 的 后 果 做 了 进一步 讨论 。 
人 如 

4-8 所 不 。 


限制 常量 = x 


m 还 有 许多 其 他 对 应 用 程序 有 用 的 限制 ， 请 参考 你 自己 系统 中 的 头 文 


注意 : NAME_MAX 是 特定 于 文件 系统 的 。 为 了 写 可 移植 性 更 
好 的 代码 ， 你 应 该 使 用 pathconf 函 数 。 详 细 信 息 请 参考 pathconf 的 手 
册页 。 


头 文 件 sysMresource.h 提 供 了 资源 操作 方面 的 定义 ， 其 中 包括 对 程序 
长 度 、 执 行 优 先 级 和 资源 等 方面 限制 进行 得 询 和 设置 的 函数 : 
#include <sys/resource.h> 
int getpriority(int which, id_t who); 
int setpriority(int which, id_t who, int priority); 
int getrlimit(int resource, struct rlimit *r_limit); 


int setrlimit(int resource, const struct rlimit *r_limit); 
int getrusage(int who, struct rusage *r_usage); 


id_t 是 一 个 整数 类 型 ， 它 用 于 用 户 和 组 标识 符 。 在 头 文件 
sys/resource.h 中 定义 的 rusage 结 构 用 来 确定 当前 程序 已 耗费 了 多 少 CPU 
时 间 ， 它 至 少 包 含 表 4-9 所 示 的 两 个 成 员 。 


表 4-9 


timeval 结 构 定 义 在 头 文件 sys/time.h 中 ， 它 包含 成 员 tv_sec 和 
tV_usec， 分 别 代表 秒 和 微 秒 。 

一 个 程序 耗费 的 CPU 时 间 可 分 为 用 户 时 间 “〈 程 序 执行 自身 的 指令 所 
耗 绍 的 时 间 〉 和 系统 时 间 (操作 系统 为 程序 执行 所 耗费 的 时 间 ， 即 执行 
输入 输出 操作 的 系统 调用 或 其 他 系统 函数 所 花费 的 时 间 ) 。 

getrusage 函 数 将 CPU 时 间 信 息 写 入 参数 r_usage 指 问 的 rusage 结 构 
中 。 参 数 who 可 以 是 表 4-10 所 示 的 常量 之 一 。 


表 4-10 


我 们 将 在 第 ee 但 考虑 到 完整 性 ， 我 们 
将 在 这 里 简单 介绍 它们 对 系统 资源 的 影响 。 就 现在 而 言 ， 了 解 下 面 一 点 
WE T: 每 个 运行 的 程序 都 有 一 个 与 之 关联 的 优先 级 ， 优 先 级 越 高 的 程 
序 将 分 配 到 更 多 的 CPU 可 用 时 间 。 


普通 用 户 只 能 降低 其 程序 的 优先 级 ， 而 不 能 升 高 。 


应 用 程序 可 以 用 getpriority 和 setpriority 函 数 确定 和 更 改 它们 (和 其 
他 程序 ) 的 优先 级 。 被 优先 级 函数 检查 或 更 改 的 进程 可 以 用 进程 标识 
Be RTE E E S EA 
4-11 PTR o 


# 4-11 
which 参数 说 8A 
TTT 
因此 ， 为 确定 当前 进程 的 优先 级 ， 你 可 以 调用 : 
priority = getpriority(PRIO PROCESS, getpid()); 


setpriority 闷 数 用 于 设置 一 个 新 的 优先 级 《如 果 可 能 的 话 〉。 
默认 的 优先 级 是 0。 正 数 优 先 级 用 于 后 台 任 务 ， 它 们 只 在 没有 其 他 
更 高 优先 级 的 任务 准备 运行 时 才 执 行 。 负 数 优 先 级 使 一 个 程序 运行 更 频 


繁 ， 获 得 更 多 的 CPU 可 用 时 间 。 优 先 级 的 有 效 范 围 是 -20~+20。 这 很 容 
易 让 人 困惑 ， 因 为 数值 越 高 ， 执 行 优先 级 反而 越 低 。 

getpriority 在 成 功 时 返回 一 个 有 效 的 优先 级 ， 失 败 时 返回 -1 并 设置 
errno 变 量 。 因 为 -1 本 身 是 一 个 有 效 的 优先 级 ， 所 以 在 调用 getpriority 之 前 
应 将 errno 设 置 为 0， 并 在 函数 返回 时 检 碍 它 是 否 仍 为 0。setpriority 在 成 
功 返 回 0， 人 否则 返回 -1。 

系统 资源 方面 的 限制 可 以 通过 getrlimit 和 setrlimit 来 读 取 和 设置 。 这 
两 个 函数 都 利用 一 个 通用 结构 rlimit 来 描述 资源 限制 。 该 结构 定义 在 头 
文件 sys/resource.h 中 ， 它 包含 表 4-12 所 示 的 成 员 。 


表 4-12 
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类 型 dim_t 是 一 个 整数 类 型 ， 它 用 来 描述 资源 级 别 。 一 般 来 说 ， 软 
限制 是 一 个 建议 性 的 最 好 不 要 超越 的 限制 ， 如 果 超 越 可 能 会 导 臻 库 函 数 
返回 错误 。 硬 限制 如 果 被 超越 ， 则 可 能 会 导致 系统 通过 发 送信 号 的 方式 
来 终止 程序 的 运行 。 例 如 ， 当 CPU 时 间 限 制 被 超越 时 系统 会 发 送 
SIGXCPU 信 号 ， 数 据 长 度 限 制 被 超越 时 系统 会 发 送 SIGSEGV 信 和 号。 程 
序 可 以 把 自己 的 软 限制 设置 为 小 于 人 硬 限制 的 任何 值 。 它 也 可 以 减 小 自己 
的 人 硬 限 制 。 但 只 有 以 超级 用 户 权 限 运 行 的 程序 才能 增加 硬 限 制 。 

有 许多 系统 资源 可 以 进行 限制 ， 它 们 由 rlimit 函 数 中 的 resource 参 数 
指定 ， 并 在 头 文件 sys/resource.h 中 定义 ， 如 表 4-13 所 示 。 


表 4-13 


下 面 的 实验 给 出 了 一 个 程序 limits.c， 它 模拟 一 个 典型 的 应 用 程序 。 
该 程序 设置 并 超越 了 一 个 资源 限制 。 


实 验 资源 限制 
C1) 首先 ， 把 你 在 程序 中 要 用 到 的 所 有 函数 对 应 的 尖 文 件 包 含 进 
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(2) void work O 函数 将 一 个 字符 串 写 入 一 个 临时 文件 10 000 
次 ， 然 后 做 一 些 算术 运算 以 产生 CPU 负载 : 


void w 


(3) = mainexi Ziv] Hworkes 2, %A a H getrusage K ÁKK I E FE Be 
的 CPU 时 间 ， 并 把 该 信息 显示 在 屏幕 上 ; 


printf : $1d.8061d, System = 214.%061d\n", 
r_usage.ru_utime.tv_sec, r_usage.ru_utime.tv 


(4) 接着 ，main 函 数 分 别 调用 getpriority 和 getrlimit 来 发 现 它 的 当前 
优先 级 和 文件 大 小 限制 : 


PRIO_PROCESS, getpidi)}: 


(5) 最 后 ， 我 们 用 setrlimit 设 置 文件 大 小 限制 并 再 次 调用 work， 这 
次 work 函 数 的 执行 会 失败 ， 因 为 它 试 图 创建 一 个 太 大 的 文件 : 


当 运 行 这 个 程序 时 ， 你 可 以 看 到 消耗 的 CPU 资源 有 多 少 以 及 程序 运 
行 的 默认 优先 级 。 一 旦 设置 了 文件 大 小 限制 ， 程 序 就 不 能 往 临 时 文件 里 
写 入 多 于 2 048 个 字 节 了 。 


$ cc -o limits limits.c -lm 
$ ./limits 
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你 可 以 用 nice 命 令 有 局 动 程序 来 改变 程序 的 优先 级 。 这 里 ， 你 看 到 程 
序 的 优先 级 变 成 了 +10。 因 此 ， 程 序 的 执行 时 间 变 长 了 。 


$ mice ./limits 


实验 解析 

limits 程 序 通过 调用 work 函 数 来 模拟 一 个 典型 程序 的 行为 。 它 执行 
一 些 运算 并 产生 一 些 输出 ， 在 本 例 中 ， 它 输出 大 约 150K 字 节 的 数据 到 
临时 文件 。 它 调用 资源 函数 来 发 现 其 优先 级 和 文件 大 小 限制 。 在 本 例 
中 ， 文 件 大 小 限制 未 设置 ， 所 以 你 想 创建 多 大 的 文件 就 可 以 创建 多 大 的 
文件 〈 只 要 磁盘 空间 多 许 ) 。 随 后 ， 程 序 设置 它 的 文件 大 小 限制 为 2K 
并 再 次 执行 一 些 工 作 。 此 时 ，work 函 数 的 亩 用 失败 了 ， 因 为 它 不 能 创建 
太 大 的 临时 文件 。 


你 也 可 以 通过 bash 的 ulimit 命 令 为 在 某 一 特定 shell 中 运行 的 程序 
设置 限制 。 


在 本 例 中 ， 出 错 信息 Error writing to temporary file《〈 写 临时 文件 出 
错 ) 可 能 不 会 像 你 期 望 的 那样 打印 出 来 。 这 是 因为 当 资源 限制 被 超越 


时 ， 一 些 系统 (如 Linux 2.2 和 后 续 版 本 ) 会 通过 发 送信 号 SIGXFSZ 的 方 
式 来 终止 程序 。 你 将 在 第 11 章 学 习 有 关 信 号 及 其 使 用 的 更 多 知识 。 其 他 
一 些 POSIX 兼 容 的 系统 可 能 只 是 让 资源 限制 被 超越 的 函数 返回 一 个 错 
IRo 


4.9 ”小 结 


在 本 章 中 ， 你 了 解 了 Linux 环 境 ， 并 对 程序 运行 的 条 件 进行 了 研 
完 。 你 学 习 了 命令 行 参数 和 环境 变量 ， 它 们 都 能 用 来 改变 程序 的 默认 行 
为 ， 并 提供 有 用 的 程序 选项 。 

你 还 看 到 程序 怎样 利用 库 函 数 来 处 理 日 期 和 时 间 值 ， 获 得 上 自身、 用 
户 及 它 运行 之 上 的 计算 机 的 相关 信息 。 

因为 Linux 程 序 通常 都 要 共 侍 主机 上 的 宝 喧 资源 ， 所 以 本 章 也 对 如 
何 确定 和 管理 资源 的 问题 做 了 介绍 。 


Res sant 


Pope 5 级 nee 


在 本 章 中 ， 你 将 看 到 如 何 完善 第 2 章 中 的 基本 应 用 程序 。 该 程序 
最 明显 的 不 足 束 是 其 用 户 界 面 ， 虽 然 它 实现 了 所 需 功 能 ， 但 并 不 好 用 。 
在 本 章 中 ， 你 将 学 习 如 何 更 好 的 控制 用 户 终 端 ， 包 括 控 制 键盘 输入 及 屏 
幕 输出 。 不 仅 如 此 ， 你 还 将 学 习 如 何 保证 编写 的 程序 能 够 从 用 户 那 里 获 
取 输 入 《即使 用 户 对 程序 使 用 了 输入 重 定 向 ) ， 以 及 确保 程序 的 输出 显 
示 在 屏幕 的 正确 位 置 上 。 

虽然 ， 重 新 实现 CD 数据 库 应 用 程序 的 构想 只 有 到 第 7 章 的 结束 才能 
见 到 上 明光， 但 你 将 在 本 章 为 第 7 章 做 大 量 的 底层 准备 工作 。 第 6 章 是 基于 
curses 的 ， 但 它 并 不 是 古老 的 叶 语 潮 ， 而 是 一 个 水 数 库 ， 它 提供 了 控制 
终端 屏幕 显示 的 高 级 代码 。 同 时 ， 我 们 还 将 通过 介绍 一 些 Linuxz 和 UNIX 
的 哲学 思想 以 及 终端 输入 和 输出 的 概念 来 前 明 早期 UNIX 社 团 成 员 的 想 
法 。 也 许 ， 我 们 在 这 里 给 出 的 底层 访问 方式 正 是 您 正在 寻找 的 。 我 们 将 
在 这 里 介绍 的 绝 大 部 分 内 容 同样 适用 于 运行 在 终端 窗口 中 的 程序 ， 如 运 
行 在 KDE 的 Kconsole、GNOME 的 gnome-terminal 或 者 是 标准 X11 的 xterm 
中 的 程序 。 

在 本 章 中 ， 你 将 学 习 以 下 内 容 : 

对 终端 进行 读 写 

终端 驱动 程序 和 通用 终端 接口 
termios 

终端 的 输出 和 terminfo 

检测 键盘 击 键 动作 


品 口 口 口 口 


在 第 3 章 中 ， 你 了 解 到 当 一 个 程序 在 命令 提示 符 中 被 调用 时 ，shell 
负责 将 标准 输入 和 标准 输出 流连 接 到 你 的 程序 。 通 过 在 程序 中 使 用 
getchar 和 Printf 函 数 ， 你 可 以 很 容易 地 对 这 些 默认 流 进 行 读 写 ， 实 现 程序 
和 用 户 之 间 的 交互 。 

在 下 面 的 实验 中 ， 你 将 使 用 上 面 提 到 的 两 个 函数 getchar 和 printf 重 写 
沫 单 例 程 ， 新 程序 的 文件 名 为 menul.c。 


K 验 用 C 语 言 编 写 的 沫 单 例 程 
(1) 程序 开始 部 分 的 语句 定义 了 一 个 用 来 显示 沫 单 内 容 的 字符 数 
sp cali 数 的 原型 : 


nt getchoice(char J 


(2) ~~ maine 函数 7 刚才 定义 的 样本 束 单 字符 数组 menu 为 参数 调用 
getchoice 函 数 : 


(3) 下 面 是 这 个 程序 的 核心 代码 : 负责 显示 采 单 及 读 取 用 户 输 入 
的 函数 getchoice: 


if{tchosen) 


whiie 


实验 解析 

getchoice 函 数 显 示 程 序 的 介绍 信息 greet 和 样本 菜单 choices， 并 要 求 
用 户 输入 代表 某 个 菜单 选项 的 站 字符 。 接 下 来 ， 程 序 进 入 循环 ， 直 到 
ae 数 返 回 与 option 字 符 数 组 中 某 个 数组 成 员 的 首 字母 匹配 的 字符 


编译 并 运行 这 个 程序 ， 你 会 发 现 它 并 没有 像 你 所 期 望 的 那样 工作 。 
下 面 的 例子 说 明了 这 一 问题 ， 


$ ./menul 

Choice: Please select an action 
a - add new record 

d - delete record 

q - quit 

a 

You have chosen: a 

Choice: Please select an action 
a - add new record 

d - delete record 

q - quit 

Incorrect choice, select again 
Choice: Please select an action 
a - add new record 

d - delete record 


q - quit 

q 

You have chosen: q 
$ 


用 户 必 须要 输入 “A/ 回 车 /Q/ 回 车 ”等 才能 做 出 选择 。 从 上 面 的 例子 中 
可 以 看 出 ， 这 个 程序 至 少 有 两 个 问题 。 最 严重 的 问题 是 ， 每 当 你 做 出 正 
确 的 选择 后 ， 屏 幕 上 都 会 出 现 错误 提示 Incorrect choice, select again 〈 错 
rrr ge ane nee come alee 
会 读 取 输 入 。 


1. 标准 模式 和 非 标准 模式 


这 两 个 问题 是 紧密 相关 的 。 默 认 情 况 下 ， 只 有 在 用 户 按 下 回 车 键 
后 ， 程 序 才 能 读 到 终端 的 输入 。 在 大 多 数 情况 下 ， 这 样 做 是 有 益 的 ， 因 
为 它 允 许 用 户 使 用 退 格 键 (Backspace) 或 删除 键 (Delete) 来 纠正 输入 
中 的 错误 ， 用 户 只 在 对 自己 在 屏幕 上 看 到 的 内 容 满 意 时 ， 才 会 按 下 回 车 
键 把 键入 的 数据 传递 给 程序 。 

这 种 处 理 方 式 被 称 为 规范 模式 (canonical mode) 或 标准 模式 
(standard mode) 。 所 有 的 输入 都 基于 行进 行 处 理 ， 在 一 个 输入 行 完 成 
前 〈 通 常 是 用 户 按 下 回 车 键 之 前 ) ， 终 端 接口 负责 管理 所 有 的 键盘 输 
入 ， 包 括 退 格 键 ， 应 用 程序 读 不 到 用 户 输入 的 任何 字符 。 

与 标准 模式 相对 的 是 非 标准 模式 (non-canonical mode) ， 在 这 种 模 
式 中 ， 应 用 程序 对 用 户 输 入 字符 的 处 理 拥有 更 大 的 控制 权 。 我 们 稍 后 会 


再 回 到 这 两 种 模式 上 来 。 

除 此 之 外 ，Linux 终 端 处 理 程序 能 够 把 中 断 字符 转换 为 对 应 的 信和 号 
(例如 ， 按 下 Ctrl+C 可 以 中 断 程序 ) 从 而 自动 奉 用 户 完成 对 退 格 键 和 删 
除 键 的 处 理 ， 用 户 无 需 在 自己 编写 的 每 个 程序 中 重新 实现 它 。 我 们 将 在 
第 11 章 详细 介绍 信和 号。 

那么 ， 这 个 程序 的 问题 究竟 在 哪里 呢 ? 是 这 样 的 ，Linux 会 暂 存 用 
户 输入 的 内 容 ， 直 到 用 户 按 下 回 车 键 ， 然 后 将 用 户 选 择 的 字符 及 紧 随 其 
后 的 回 车 符 一 起 传递 给 程序 。 所 以 ， 每 当 你 输入 一 个 菜单 选择 时 ， 程 序 
就 调用 getchar 函 数 处 理 该 字符 ， 而 当 程 序 在 下 一 次 循环 中 再 次 调用 
getchar 函 数 时 ， 它 会 立刻 返回 一 个 回 车 符 。 

程序 真正 看 到 的 字符 并 不 是 ASCII 码 的 回 车 符 CR“〈 十 进 制 表示 为 
13， 十 六 进 制 表示 为 OD) ， 而 是 换行 符 LF 〈 十 进 制 表示 为 10， 十 六 进 
制 表示 为 OA) 。 这 是 因为 ，Linux 同 UNIX 系 统一 样 ， 在 其 内 部 都 是 以 
换行 符 作 为 文本 行 的 结束 。 也 就 是 说 ，UNIX 用 一 个 单独 的 换行 符 来 表 
示 一 行 的 结束 ， 而 其 他 的 操作 系统 (如 MS-DOS) 用 回 车 符 和 换行 符 两 
个 字符 的 结合 来 表示 一 行 的 结束 。 如 果 输 入 或 输出 设备 本 身 需 要 发 送 或 
接收 一 个 回 车 符 ， 则 由 Linux 终 端 处 理 程序 负责 完成 它 。 如 果 你 已 经 习 
惯 MS-DOS 或 其 他 操作 系统 的 环境 ， 你 可 能 会 对 Linux 的 这 种 做 法 感到 有 
一 些 奇 怪 。 但 这 样 做 的 最 大 好 处 是 ， 它 使 得 在 Linux 系 统 中 ， 文 本 文件 
和 二 进 制 文件 无 任何 实际 的 区 别 。 只 有 在 对 终端 、 某 些 打 印 机 或 绘图 仪 
进行 输入 输出 时 ， 你 才 需 要 对 回 车 符 进 行 处 理 。 

z 在 下 面 的 代码 中 ， 通 过 忽略 额外 的 换行 符 来 纠正 菜单 例 程 中 的 主要 
HIR: 


do { 


selected = getchar(); 
) while(selected =» '\n') 


它 解 决 了 燃眉之急 ， 你 将 看 到 如 下 所 示 的 输出 : 
$ ./menul 

Choice: Please select an action 

a ~ add new record 

d - delete record 


- quit 


You have chosen: a 
Choice: Please select an action 
a - add new record 
a - delete record 


G - quit 


a 


You have chosen: q 


我 们 将 在 本 章 的 后 面 针 对 这 个 程序 的 第 二 个 问题 “必须 按 下 回 车 键 
才能 让 程序 继续 执行 ”， 给 出 一 个 更 加 精巧 的 解决 方案 。 


2. 处 理 重 定向 输出 


Linux 程 序 ， 甚 至 是 交互 式 的 Linux 程 序 ， 经 常会 把 它们 的 输入 或 输 
出 重 定 癌 到 文件 或 其 他 程序 。 我 们 来 看 看 把 程序 的 输出 重 定 同 到 一 个 文 
件 时 出 现 的 情况 : 


S ./menul > file 
a 


q 
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你 可 以 把 这 种 处 理 方 式 看 作 是 成 功 的 ， 因 为 程序 的 输出 确实 被 重 定 
向 到 文件 ， 而 不 是 显示 在 终端 上 。 但 有 时 你 并 不 想 这 么 做 ， 或 者 你 希望 
对 准备 让 用 户 看 到 的 提示 信息 与 其 他 输出 进行 区 别 对待 ， 前 者 仍然 输出 
到 终端 上 ， 而 后 者 可 以 被 安全 地 重 定 向 。 

如 果 想 知道 标准 输出 是 否 被 重 定 向 了 ， 只 需 检查 底层 文件 描述 符 是 
否 关联 到 一 个 终端 即 可 。 系 统 调用 isatty 就 是 用 来 完成 这 一 任务 的 。 你 只 
需 将 有 效 的 文件 描述 符 传递 给 它 ， 它 就 可 判断 出 该 描述 符 是 否 连接 到 一 
人 终端 。 


#include <unistd.h> 


int isatty(int fd); 


如 果 打 开 的 文件 描述 符 fd 连 接 到 一 个 终端 ， 则 系统 调用 isatty 返 回 
1， 奋 则 人 返回 0。 

在 这 个 程序 中 ， 你 使 用 的 是 文件 流 ， 但 isatty 只 能 对 文件 描述 符 进 行 
操作 。 为 了 提供 必要 的 转换 ， 你 需要 把 isatty 调 用 与 在 第 3 章 中 介绍 的 
fileno 函 数 结合 使 用 。 

如 果 stdout〈 标 准 输出 ) 已 被 重 定 向 ， 你 该 做 什么 呢 ? 直接 退出 不 


古 一 个 好 办 法 ， 因 为 用 户 无 法 知道 程序 为 什么 会 运行 失败 。 癌 stdout 输 
出 一 条 消 妃 也 不 起 作用 ， 因 为 这 条 消息 也 会 被 重 定 癌 。 一 种 解决 方法 是 
将 消息 写 到 stderr〈 标 准 错误 输出 ) ， 它 不 会 被 shell 的 >file 命 令 重 定向 。 


X 验 检查 是 否 存 在 输出 重 定 同 
沿用 上 面 实验 中 创建 的 menul.c 程 序 ， 在 其 中 加 上 新 的 include 语 
颁 ， 对 main 函 数 进行 如 下 的 修改 ， 并 重新 将 该 程序 命名 为 menu2.C。 


#include <unistd.h> 


int main() 
{ 


int choice = 0; 


if(tisatty(fileno(stdout))) { 
fprintf(stderr, "You are not a terminal!\n"); 
exit(1); 

} 

do { 


choice = getchoice("Please select an action", menu); 
printf("You have chosen: %c\n", choice); 


} while(choice != 'q'); 
exit (0); 
) 
YoE eS O 人 ` A 
请 看 这 个 程序 给 出 的 样本 输出 : 
$ ./menu2 
Choice: Please select an action 
a - add new record 
a delete record 
q - quit 


q 

You have chosen: q 

S$ menu2 > file 

You are not a terminal! 
¢ 


+ 


实验 解析 

新 代码 段 用 isatty 函 数 来 测试 标准 输出 是 否 已 连接 到 一 个 终端 ， 如 果 
没有 ， 则 退出 程序 。shell 也 用 同一 种 技术 来 判断 是 否 需要 提供 终端 提示 
符 。 将 stdout 和 stderr 同 时 重 定 同 也 是 可 能 的 ， 而 且 极 为 名 见 。 你 可 以 像 
下 面 这 样 把 错误 流 重 定向 到 另 一 个 文件 : 


S$ ./menu2 >file 2>file.error 
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或 者 如 下 面 这 样 ， 将 两 个 输出 流 重 定 问 到 同一 个 文件 : 
$ ./menu2 >file 2>&1 
$ 
如 果 你 不 熟悉 输出 重 定向 的 语法 ， 请 仔细 阅读 本 书 的 第 2 章 。 在 该 


章 中 ， 我 们 详细 介绍 了 它 的 语法 。 在 本 例 中 ， 你 需要 将 错误 信息 直接 发 
送 到 用 户 终 端 上 。 


5.2 与 终端 进行 对 话 


如 果 不 和 希望 程序 中 与 用 户 交 互 的 部 分 被 重 定 同 ， 但 允许 其 他 的 输入 
和 和 输出 被 重 定向 ， 你 就 需要 将 与 用 户 交 互 的 部 分 与 stdout、stderr 分 离 
Fe E GRAY EL PES ZA mE TIS. HFLinxk FESPA, 
它 通常 拥有 多 个 终端 ， 这 些 终端 或 者 是 直接 连接 的 ， 或 者 是 通过 网 络 进 
ITER, WA, MERTA 找到 要 使 用 的 正确 终端 呢 ? 

幸运 的 是 ，Linux 和 UNIX 提 供 了 一 个 特殊 设备 /dev/tty 来 解决 这 一 问 
题 ， 该 设备 始终 是 指 问 当前 终端 或 当前 的 登录 会 话 。 由 于 Linux 把 一 切 
事物 都 看 作为 文件 ， 所 以 你 可 以 用 一 般 文 件 的 操作 方式 来 对 /dewtty 进 行 
GES 

在 下 面 的 实验 中 ， 你 通过 向 getchoice 函 数 传递 参数 的 方法 来 加 强 对 
输出 的 控制 ， 修 改 后 的 程序 为 menu3.c。 


实 验 使 用 /dev/tty 


以 menu2.c 程 序 为 蓝本 ， 对 其 做 如 下 修改 ， 使 得 输入 和 输出 直接 指 
[HJ /dev/tty: 


int getchoice(char "greet, char *choices[{], PILE *in, PILE *out); 
FILE nput 
LE *outp 
(iisatty leno (stdout 
fprinté stderr,*You are not a terminal, OK.\n"); 
input = fopen("/dev/tty", *r*); 
output = fopen(*/dev/tty*, “w"); 


f(tinput || foutpuc) { 
fprintf(stderr, "Unable to open /dev/tty\n*); 


choice = getchoice(*Please select an action", menu, input, output); 
printf£("You have chosen: %c\n", choice): 
} whileichoice != ‘q'); 
exit(0); 
) 


int getchoice(char *greet, char *choices[}]. FILE *in, FILE *out) 
{ 

int chosen = 0; 

int selected; 

char **option: 


do ( 
fprincf (out, "Choice: s\n", greet); 
option = choices; 
while(*option) { 
fprintf (out, “ts\n*, *option) ; 
options; 
) 
do { 
selected = fgetc(in); 
} while(selected == ‘\n')}; 
option = choices; 
while(*option) { 
if(selected == *option[0]}) { 
chosen = 1; 
break; 
} 
option++; 
} 
if(!chosen) { 
fprintf (out, "Incorrect choice, select again\n"); 
} 
) while(!chosen): 
return selected; 


现在 ， 当 运行 这 个 程序 并 将 输出 进行 重 定 向 时 ， 你 仍然 可 以 在 终端 
上 看 到 沫 单 提示 信息 ， 但 程序 的 其 他 输出 〈 如 表明 菜单 项 已 被 选择 ) 则 
被 重 定 癌 到 文件 中 。 


$ ./menu3 > file 

You are not a terminal, OK. 
Choice: Please select an action 
a - add new record 

d - delete record 

q - quit 

d 

Choice: Please select an action 
a - add new record 

d - delete record 


Qq - quit 
q 
$ cat file 


You have chosen: d 
You have chosen: q 


有 了 时， 程序 需要 更 精细 的 终端 控制 能 力 ， 而 不 是 仅 通 过 简单 的 文件 
操作 来 完成 对 终端 的 一 些 控 制 。Linux 提 供 了 一 组 编程 接口 用 来 控制 终 
端 驱 动 程序 的 行为 ， 从 而 使 得 更 好 地 控制 终端 的 输入 和 输出 。 


5.3.1 概述 


如 图 5-1 所 示 ， 你 可 以 通过 一 组 函数 调用 《通用 终端 接口 ， 简 称 
GTD 来 控制 终端 ， 这 组 函数 调用 与 用 于 读 写 数据 的 函数 是 分 离 的 ， 这 
就 使 得 读 写 数据 的 接口 非常 简洁， 同时 又 允许 用 户 可 以 对 终端 的 行为 进 
行 更 精细 的 控制 。 但 这 并 不 意味 着 终端 MO 接口 也 非常 简洁 ， 相 反 ， 它 
需要 支持 大 量 不 同类 型 的 硬件 。 


用 户 程 序 


内 核 中 的 终端 
驱动 程序 


用 UNIX 的 术语 来 说 ， 控 制 接口 定义 了 一 个 “线路 规程 "， 它 使 程序 
在 指定 终端 驱动 程 友 的 行为 时 拥有 极 大 的 灵活 性 。 
下 面 是 你 能 够 控制 的 主要 功能 。 
O 行 编辑 : 是 否 人 允许 用 退 格 键 进行 编辑 。 
T ee ee 
wi 
O 回 显 :允许 控制 字符 的 回 显 ， 例 如 读 取 密 码 时 。 


O 回 车 /换行 《CRALEF) : 定义 如 何在 输入 /输出 时 映射 回 车 /换行 
符 ， 比 如 打印 字符 时 应 该 如 何 处 理 。 

O R: 这 一 功能 很 少 用 于 PC 控制 台 ， 但 对 调制 解 调 器 或 通过 串 
行 线 连接 的 终端 就 很 重要 。 


5.3.2” 便 件 模型 
在 学 习 通 用 终 站 接口 之 前 ， 你 十 分 有 必要 先 理解 它 所 要 驱动 的 硬件 


模型 。 
图 5-2 所 示 的 概念 布局 图 〈 某 些 早期 UNIX 站 点 的 实际 情况 就 是 这 
样 ) 是 让 一 台 UNIX 机 器 通过 串 行 口 连接 一 台 调 制 解 调 器 ， 再 通过 电话 
线 连 接 到 用 户 端的 调制 解 调 器 ， 该 调制 解 调 器 最 终 连 接 到 用 户 的 终端 。 
事实 上 ， 这 正 是 某 些 小 型 TISP《〈 因 特 网 服务 提供 商 ) 在 因特网 早期 使 用 
的 一 种 配置 情况 。 这 种 连接 方式 可 以 看 作 是 客户 /服务 器 模型 的 一 个 “ 远 
亲 ”， 它 用 于 程序 运行 在 大 型 主机 上 ， 而 用 户 工 作 在 哑 终 端的 情况 。 


应 用 程序 
数据 读 / 写 接口 | 控制 接口 


| UNIX 内 核 


Lit ett | 


“hik” 


图 5-2 


如 果 你 工作 在 一 台 运 行 着 Linux 系 统 的 PC 上 ， 可 能 会 认为 这 个 模型 
过 于 复杂 。 但 因为 本 书 的 两 位 作者 都 有 调制 解 调 右 ， 所 以 如 果 愿 意 的 
话 ， 就 可 以 按照 图 中 的 方式 用 一 对 调制 解 调 器 和 电话 线 将 两 人 的 电脑 连 
接 起 来 ， 并 通过 终端 仿真 程序 〈 如 minicom) 远程 登录 到 对 方 的 机 器 


上 。 当 然 ， 如 今 的 快速 宽带 接 入 已 让 这 种 类 型 的 连接 方式 过 时 ， 但 这 个 
人 硬件 模型 仍 有 其 用 处 。 

使 用 这 样 一 个 硬件 模型 的 好 处 是 ， 绝 大 多 数 现实 世界 中 的 情况 都 只 
是 这 一 最 复杂 情况 的 子 集 。 如 果 这 个 模型 忽略 了 一 些 功能 ， 那 么 它 就 不 
能 很 好 的 文 持 各 种 现实 情况 。 


5.4 _ termios 结 构 


termios 是 在 POSIX 规 范 中 定义 的 标准 接口 ， 它 类 似 于 系统 V 中 的 
termio 接 口 。 通 过 设置 termios 类 型 的 数据 结构 中 的 值 和 使 用 一 小 组 函数 
调用 ， 你 就 可 以 对 终端 接口 进行 控制 。termios 数 据 结构 和 相关 函数 调用 
都 定义 在 头 文件 termios.h 中 。 


如 果 程 序 需要 调用 定义 在 termios.h 头 文件 中 的 函数 ， 它 就 需要 
与 一 个 正确 的 函数 库 进行 链接 ， 这 个 函数 库 可 能 是 标准 的 C 函 数 库 
或 者 curses 函 数 库 (取决 于 你 的 安装 情况 ) 。 如 果 需 要 ， 在 编译 本 
章 中 的 示例 程序 时 ， 在 编译 命令 的 末尾 加 上 -lcurses。 在 一 些 老 版 本 
的 Linux 系 统 中 ，curses 库 被 命名 为 ew ”curses。 在 这 种 情况 下 ， 库 
名 和 链接 参数 就 需要 相应 地 改 为 ncurses 和 -lncurses。 


可 以 被 调整 来 影响 终端 的 值 按照 不 同 的 模式 被 分 成 如 下 几 组 : 
输入 模式 

输出 模式 

控制 模式 

本 地 模式 

特殊 控制 字符 

最 小 的 termios 结 构 的 典型 定义 如 下 (X/Open 规范 允许 包含 附加 字 
Xx): 


#include <termios.h> 

struct termios { 
tcflag t c_iflag; 
tcflag t c_oflag; 
tcflag t c_cflag; 
tcflag t c_lflag; 
cc_t c_cc[NCCS]; 


OOOOdOd 


}; 


结构 成 员 的 名 称 与 上 面 列 出 的 5 种 参数 类 型 相对 应 。 
你 可 以 调用 函数 tcgetattr 来 初始 化 与 一 个 终端 对 应 的 termios 结 构 ， 
该 函数 的 原型 如 下 : 


#include <termios.h> 


int tcgetattr(int fd, struct termios *termios_p); 


这 个 函数 调用 把 当前 终端 接口 变量 的 值 写 入 termios_p 参 数 指向 的 结 
构 。 如 果 这 些 值 其 后 被 修改 了 ， 你 可 通过 调用 函数 tcsetattr 来 重新 配置 终 
端 接口 ， 该 函数 的 原型 如 下 : 


int tcsetattr(int fd, int actions, const struct termios *termios_p); 


参数 actions 控 制 修改 方式 ， 共 有 3 种 修改 方式 ， 如 下 所 示 。 

O TCSANOW: 立 刻 对 值 进行 修改 。 

O TCSADRAIN: 等 当前 的 输出 完成 后 再 对 值 进行 修改 。 

O TCSAFLUSH: 等 当前 的 输出 完成 后 再 对 值 进 行 修 改 ， 但 丢弃 
还 未 从 read 调 用 返回 的 当前 可 用 的 任何 输入 。 


注意 ， 程 序 有 员 任 将 终端 设置 恢复 到 程序 开始 运行 之 前 的 状 
态 ， 这 一 所 是 非常 重要 的 。 首 先 保存 这 些 值 ， 然 后 在 程序 结束 时 恢 
复 它 们 ， 这 永远 是 程序 的 职责 。 


接 下 来 ， 我 们 将 仔细 分 析 各 种 模式 和 相关 的 函数 调用 。 一 些 模式 的 
AWE HA. Sab, MARDER, PROBE RSPR EB 
能 。 如 果 读 者 需要 了 解 更 多 内 容 ， 请 查 疝 man 帮 助手 册 或 POSIX、 
X/Open 的 规范 文档 。 

你 首先 应 该 了 解 的 是 本 地 横 式 ， 它 也 是 最 重要 的 一 种 模式 。 我 们 在 
本 章 中 编写 的 第 一 个 应 用 程序 出 现 了 两 个 问题 ， 其 中 第 二 个 问题 〈 用 户 
必须 按 下 回 车 键 才能 让 程序 读 取 输入 ) 的 解决 方法 是 使 用 标准 模式 或 非 
标准 模式 ， 即 你 可 以 让 程序 等 待 一 行 输入 完毕 后 再 进行 处 理 ， 或 让 它 一 
有 字符 键入 就 立刻 处 理 。 


5.4.1 输入 模式 


输入 模式 控制 输入 数据 (终端 驱动 程序 从 串 行 口 或 键盘 接收 到 的 字 
符 ) 在 被 传递 给 程序 之 前 的 处 理 方式 。 你 通过 设置 termios 结 构 中 c_iflag 
成 员 的 标志 对 它们 进行 控制 。 所 有 的 标志 都 被 定义 为 宏 ， 并 可 通过 按 位 
或 的 方式 结合 起 来 。 这 也 是 所 有 终端 模式 都 采用 的 方法 。 

可 用 于 c_iflag 成 员 的 宏 如 下 所 示 。 

O BRKINT: 当 在 输入 行 中 检测 到 一 个 终止 状态 (连接 丢失 ) 
时 ， 产 生 一 个 中 断 。 


IGNBRK: 忽 略 输入 行 中 的 终止 状态 。 
ICRNL: 将 接收 到 的 回 车 符 转换 为 新 行 符 。 
IGNCR: 忽 略 接收 到 的 回 车 符 。 
INLCR: 将 接收 到 的 新 行 符 转 换 为 回 车 符 。 
IGNPAR: 忽 略 奇偶 校 验 错 误 的 字符 。 
INPCK: 对 接收 到 的 字符 执行 奇偶 校 验 。 
PARMRK: 对 奇偶 校 验 错误 做 出 标记 。 
ISTRIP: 将 所 有 接收 到 的 字符 裁减 为 7 比特 。 
IXOFF: 对 输入 启用 软件 流 控 。 
IXON: 对 输出 启用 软件 流 控 。 


如 果 BRKINT 和 IGNBRK 标 志 都 未 被 设置 ， 则 输入 行 中 的 终止 
状态 就 被 读 取 为 NULL (0x00) 字符 。 


用 户 一 般 无 需 频 繁 修改 输入 模式 ， 因 为 它 的 默认 值 通 党 就 是 最 合适 
的 ， 所 以 我 们 在 这 里 就 不 过 多 讨论 了 。 


5.4.2 输出 模式 


输出 模式 控制 输出 字符 的 处 理 方式 ， 即 由 程序 发 送出 去 的 字符 在 传 
递 到 串 行 口 或 屏幕 之 前 是 如 何 处 理 的 。 正 如 你 预料 的 那样 ， 许 多 处 理 方 
式 正 好 与 输入 模式 对 应 。 它 还 有 几 个 其 他 标志 ， 主 要 用 于 慢 速 终端 ， 
为 这 些 终 端 在 处 理 回 车 符 等 字符 时 需要 花费 一 定 的 时 间 。 几 乎 所 有 这 些 
标志 不 是 多 余 的 《因为 现在 的 终端 速度 比 以 前 要 快 得 多 ) ， 驶 是 用 具有 
终端 处 理 能 力 的 terminfo 数 据 库 处 理会 更 有 效 ( 在 本 章 的 后 面 你 会 用 到 
该 数据 库 ) 。 

你 通过 设置 termios 结 构 中 c_oflag 成 员 的 标志 对 输出 模式 进行 控制 。 
可 用 于 c_oflag 成 员 的 宏 如 下 所 示 。 

OPOST: 打 开 输 出 处 理 功能 。 

ONLCR: 将 输出 中 的 换行 符 转 换 为 回 车 /换行 符 。 
OCRNL: 将 输出 中 的 回 车 符 转 换 为 新 行 符 。 
ONOCR: 在 第 0 列 不 输出 回 车 符 。 

ONLRET: 不 输出 回 车 符 。 卫 
OFILL: 发 送 填 充 字 符 以 提供 延 时 。 

OFDEL: 用 DEL 而 不 是 NULL 字 符 作 为 填充 字符 。 
NLDLY: 新 行 符 延 时 选择 。 

CRDLY: 回 车 符 延 时 选择 。 


口 口 口 口 口 口 口 口 口 口 


口 口 口 口 口 口 口 口 口 


TABDLY: 制 表 符 延 时 选择 。 

BSDLY: 退 格 符 延 时 选择 。 

VTDLY: 垂 直 制 表 符 延 时 选择 。 

FFDLY: 换 页 符 延 时 选择 。 

各 果 没有 设置 OPOST， 则 所 有 其 他 标志 都 被 忽略 。 

由 于 输出 模式 用 得 也 不 多 ， 所 以 我 们 在 此 也 不 做 过 多 的 讨论 。 


5.4.3 ”控制 模式 


控制 模式 控制 终端 的 硬件 特性 。 你 通过 设置 termios 结 构 中 c_cflag 成 
员 的 标志 对 控制 模式 进行 配置 。 可 用 于 c_cflag 成 员 的 宏 如 下 所 示 。 
CLOCAL: 忽 略 所 有 调制 解 调 器 的 状态 行 
CREAD: 启用 字 FF BUC AE o 
CS5: 发 送 或 接收 字符 时 使 用 5 比特 。 
CS6: 发 送 或 接收 字符 时 使 用 6 比特 。 
CS7: 发 送 或 接收 字符 时 使 用 7 比特 。 
CS8: 发 送 或 接收 字符 时 使 用 8 比特 。 
CSTOPB: 每 个 字符 使 用 两 个 停止 位 而 不 是 一 个 。 
HUPCL: 关 闭 时 挂 断 调制 解 调 器 。 
PARENB: 启 用 奇偶 校 验 码 的 生成 和 检测 功能 
PARODD: 使 用 奇 校 验 而 不 是 偶 校 验 。 


如 条 设 置 了 HUPCL 标 志 ， 当 终 痛 驱动 程序 检测 到 与 终端 对 应 
的 最 后 一 个 文件 描述 符 被 关闭 时 ， 它 将 通过 设置 调制 解 调 器 的 控制 
ZROR TE Wt HATE 2a o 
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和 终端 进行 “对话 ”。 但 与 通过 使 用 termios 的 控制 模式 来 修改 默认 的 线路 
行为 相 比 ， 直 接 修改 终 痢 配置 文件 通常 更 加 容易 一 些 。 


H- 


5.4.4 地 模式 


本 地 模式 控制 终端 的 各 种 特性 。 你 通过 设置 termios 结 构 中 c_lflag 成 
员 的 标志 对 本 地 模式 进行 配置 。 可 用 于 c_lflag 成 员 的 宏 如 下 所 示 。 

口 ECHO: 启 用 输入 字符 的 本 地 回 显 功能 。 

O ECHOE: 接收 到 ERASE 时 执行 退 格 、 空 格 、 退 格 的 动作 组 合 。 

O ECHOK: 接收 到 KILL 字 符 时 执行 行 删 除 操作 。 

O ECHONL: 回 显 新 行 符 


OOOO 
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ICANON: 启用 标准 输入 人 处理 (参见 下 面 的 说 明 )。 

IEXTEN: 启 用 基于 特定 实现 的 函数 。 

ISIG: 启 用 信号 。 

NOFLSH: 禁 止 清 空 队列 。 

TOSTOP: 在 试图 进行 写 操作 之 前 给 后 台 进 程 发 送 一 个 信号 。 
这 里 最 重要 的 两 个 标志 是 ECHO 和 ICANON。 前 者 的 作用 是 抑制 键 

入 字符 的 回 显 ， 而 后 者 是 将 终端 在 两 个 截然 不 同 的 接收 字符 处 理 模式 间 


OOOdOd 


进行 切换 。 如 果 设 置 了 ICANON 标 关 ， 束 后 用 标准 输入 行 处 理 模式 ， 合 
则 ， 束 局 用 非 标 准 模式 。 


特殊 控制 字符 是 一 些 字符 组 合 ， 如 Ctrl+C， 当 用 户 键 入 这 样 的 组 合 
键 时 ， 终 端 会 采取 一 些 特殊 的 处 理 方式 。termios 结 构 中 的 c_cc 数 组 成 员 
将 各 种 特殊 控制 字符 映射 到 对 应 的 支持 函数 。 每 个 字符 的 
位 置 ( 它 在 数组 中 的 下 标 〉 是 由 一 个 宏 定 义 的 ， 但 并 不 限制 这 些 字符 必 
须 是 控制 字符 。 

根据 终端 是 否 被 设置 为 标准 模式 〈 即 termios 结 构 中 c_lflag 成 员 是 否 
设置 了 ICANON 标 志 ) ，c_cc 数 组 有 两 种 差别 很 大 的 用 法 。 

要 特别 注意 的 一 点 是 ， 在 两 种 不 同 的 模式 下 ， 数 组 下 标 值 有 一 部 分 
出 于 这 个 原因 ， 你 一 定 要 注意 不 要 将 两 种 模式 各 自 的 下 标 值 
混用 。 

下 面 是 在 标准 模式 中 可 以 使 用 的 数组 下 标 。 

VEOF:EOF 字 符 。 
VEOL:EOL 字 符 。 
VERASE:ERASE 字 符 。 
VINTR:INTR 字 符 。 
VKILL:KILL 字 符 。 
VQUIT:QUIT 字 符 。 
VSUSP: SUSP 字 符 。 
VSTART:START 字 符 。 
VSTOP: STOP 字 符 。 
下 面 是 在 非 标准 模式 中 可 以 使 用 的 数组 下 标 。 
VINTR: INTR 字 符 。 
VMIN:MIN 值 。 
VQUIT:QUIT 字 符 。 
VSUSP: SUSP 字 符 。 


口 口 口 口 口 口 口 口 口 


口 口 口 口 


O VTIME:TIME 值 。 
O VYSTART:START 字 符 。 
口 VSTOP: STOP 字 符 。 


1， 字 符 


. TN 


由 于 这 些 特殊 字符 和 非 标准 值 对 于 输入 字符 的 高 级 处 理 非常 重要 ， 
所 以 我 们 在 这 里 对 它们 进行 详细 的 解释 ， 如 表 5-1 所 示 。 


# 5-1 
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2. TIME 和 MIN 值 


TIME 和 MIN 的 值 只 能 用 于 非 标准 模式 ， 两 者 结合 起 来 共同 控制 对 
输入 的 读 取 。 此 外 ， 两 者 的 结合 使 用 还 能 控制 在 一 个 程序 试图 读 取 与 一 
个 终端 关联 的 文件 描述 符 时 将 发 生 的 情况 。 

两 者 的 结合 分 为 如 下 4 种 情况 。 

口 MIN=0 和 TIME=0: 在 这 种 情况 下 ，read 调 用 总 是 立刻 返回 。 如 

果 有 等 待 处 理 的 字符 ， 它 们 就 会 被 返回 :如 果 没 有 字符 等 待 处 理 ， 

read 调 用 返回 0， 并 且 不 读 取 任何 字符 。 

口 MIN = 0 和 TIME >0: 在 这 种 情况 下 ， 只 要 有 字符 可 以 处 理 或 者 

是 经 过 TIME 个 十 分 之 一 秒 的 时 间 间 隔 ，read 调 用 就 返回 。 如 果 因 为 

超时 而 未 读 到 任何 字符 ，read 返 回 0， 和 否则 read 返 回 读 取 的 字符 数 

Els 


O MIN>0 和 TIME = 0: 在 这 种 情况 下 ，read 调 用 将 一 直 等 待 ， 直 
到 有 MIN 个 字符 可 以 读 取 时 才 返 回 ， 返 回 值 是 读 取 的 字符 数量 。 到 
达 文 件 尾 时 返回 0。 

口 MIN >0 和 TIME >0: 这 是 最 复杂 的 一 种 情况 。 当 read 被 调用 
时 ， 它 会 等 待 接收 一 个 字符 。 在 接收 到 第 一 个 字符 及 后 续 的 每 个 字 
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它 ) 。 当 有 MIN 个 字符 可 读 或 两 个 字符 之 间 的 时 间 间 隔 超 过 TIME 
个 十 分 之 一 秒 时 ，read 调 用 返回 。 这 个 功能 可 用 于 区 分 是 单独 按 下 
了 Escape 键 还 是 按 下 一 个 以 Escape 键 开始 的 功能 组 合 键 。 但 要 注意 
的 是 ， 网 络 通信 或 处 理 器 的 高 负载 将 使 得 类 似 这 样 的 定时 器 失去 作 


用 。 

通过 设置 非 标准 模式 与 使 用 MIM 和 TIME 值 ， 程 序 可 以 逐个 字符 地 
处 理 输 入 。 

3. 通过 shell 访 问 终 端 模式 


如 果 在 使 用 shell 时 想 查 看 当前 的 termios 设 置 情况 ， 可 以 使 用 下 面 的 


ay 


令 : 
` 


2 


stty -a 


在 我 的 Linux 系 统 上 “〔 它 对 标准 termios 结 构 进 行 了 一 些 扩 展 ) ， 这 
个 命令 的 输出 如 下 : 


从 上 面 的 命令 输出 中 ， 你 可 以 看 到 ，EOF 字 符 是 Ctrl+D 并 且 局 用 了 
本 地 回 显 。 当 在 做 终端 控制 的 练习 时 ， 一 不 小 心 就 会 将 终端 设置 为 非 标 
E A 
FA o 
Sa ear nee ee aU rr selva 
法 ) : 
9 stty sane 
O “如 果 回 车 键 和 新 行 符 〈 用 于 终止 输入 行 ) 的 映射 关系 丢失 了 ， 


你 可 能 惑 需要 输入 命令 stty sane, 

然后 按 下 Ctrl+J《〈 它 对 应 新 行 符 ) ， 而 不 是 按 下 回 车 键 Enter。 

口 “ 第 二 种 方法 是 用 命令 stty-g 将 当前 的 stty 设 置 保存 到 某 种 可 以 重 
新 读 取 的 形式 中 。 使 用 的 命令 如 下 : 


S$ stty -g > save stty 


<experiment with settings> 


$ stty $(cat save stty) 


口 注意 ， 对 最 后 一 个 stty 命 令 ， 你 可 能 还 需要 使 用 Ctrl+J 的 组 合 键 
来 代 蔡 回 车 键 Enter。 你 也 可 以 在 shell 脚 本 中 使 用 相同 的 方法 : 


stty= g 
<alter stty settings> 


O WR EPA eR Re, AAS PTI, EM 
男 一 个 终端 登录 ， 用 ps 命令 查找 不 能 使 用 的 那个 shell 的 进程 号 ， 然 
后 用 命令 kill HUP < 进程 号 > 强制 中 止 该 shell。 因 为 系统 总 是 在 给 出 
登录 提示 符 之 前 重 置 stty 参 数 ， 所 以 你 就 可 以 正 稼 地 登录 系统 了 。 
4. 在 命令 提示 符 下 设置 终端 模式 
你 还 可 以 在 命令 提示 符 下 用 stty 命 令 直接 设置 终端 模式 。 l 
比如 说 ， 如 果 想 让 shel 脚 本 可 以 读 取 单 字符 ， 你 就 需要 关闭 终端 的 
标准 模式 ， 同 时 将 MIN 设 为 1，TIME 设 为 0。 使 用 的 命令 如 下 : 
$ stty -icanon min 1 time 0 
现在 终端 已 被 设置 为 可 立刻 读 取 字 符 了 。 如 果 重 新 运行 第 一 个 程序 
menul， 你 会 发 现 它 将 按照 设计 的 要 求 正常 工作 。 
你 还 可 以 对 第 2 章 的 密码 检查 程序 加 以 改进 ， 在 程序 提示 输入 密码 
前 将 回 显 功能 关闭 。 使 用 的 命令 如 下 : 


$ stty -echo 


注意 ， 在 使 用 上 面 命令 之 后 要 记 住 用 命令 stty echo 将 回 显 功能 
再 次 恢复 局 用 。 


5.4.6 ”终端 速度 


termios 结 构 提 供 的 最 后 一 个 功能 是 控制 终端 速度 ， 但 termios 结 构 中 
并 没有 与 终端 速度 对 应 的 成 员 ， 它 是 通过 函数 调用 来 进行 设置 的 。 要 注 


意 的 是 ， 输 入 速度 和 输出 速度 是 分 开 处 理 的 。 
4 个 函数 调用 的 原型 如 下 : 
#include <termios.h> 
speed_t cfgetispeed(const struct termios *); 
speed t cfgetospeed(const struct termios *); 


int cfsetispeed(struct termios *, speed_t speed); 
int cfsetospeed(struct termios *, speed_t speed); 


注意 ， 这 些 函 数 作 用 于 termios 结 构 ， 而 不 是 直接 作用 于 端口 。 这 意 
味 着 ， 要 想 设 置 新 的 终端 速度 ， 你 就 必须 首先 用 函数 tcgetattr 获 取 当 前 
mn I ca 
写 回 termios 结 构 。 只 有 在 调用 了 函数 tcsetattr 之 后 ， 终 端 速 度 才 会 改变 。 

上 面 函数 调用 中 speed 参 数 可 设置 的 值 很 多 ， 下 面 是 最 重要 的 
B0: 挂 起 终端 。 

B1200: 1200 波 特 。 
B2400: 2400 波 特 。 
B9600: 9600 波 特 。 
B19200: 19200 波 特 。 
B38400: 38400 波 特 。 

标准 中 没有 定义 天 于 38400 波 特 的 速度 ， 也 无 标准 方法 用 来 支持 串 

行 口 的 速度 大 于 它 。 


包括 Linux 在 内 的 一 些 操 作 系 统 ， 为 了 支持 更 高 的 速度 ， 补 充 
定义 了 值 B57600、B115200 和 B230400。 如 果 使 用 的 Linux 版 本 比较 
低 ， 它 可 能 没有 定义 这 些 值 ， 但 可 以 通过 命令 setserial 来 获取 57600 
和 115200 这 样 的 非 标 准 速度 。 要 注意 的 是 ， 在 这 种 情况 下 ， 只 有 当 
先 设置 了 B38400 后 ， 才 能 使 用 这 些 速度 。 这 两 种 方法 都 不 具备 可 移 
植 性 ， 所 以 你 在 使 用 它们 时 要 考虑 清楚 。 


5.4.7 ”其 他 函数 


在 控制 终端 方面 还 有 一 些 其 他 的 函数 。 它 们 直接 对 文件 描述 符 进行 
操作 ， 不 需要 读 写 termios 结 构 。 它 们 的 定义 如 下 : 


#include <termios.h> 


OOOOd0O 


int tcdrain(int fd); 
int tcflow(int fd, int flowtype); 
int tcflush(int fd, int in_out_selector); 


这 些 函 数 的 功能 如 下 所 示 。 

O 函数 tcdrain 的 作用 是 让 调用 程序 一 直 等 待 ， 直 到 所 有 排队 的 输 

出 都 已 发 送 完毕 。 

口 “ 函 数 tcflow 用 于 暂停 或 重新 开始 输出 。 

口 “ 函 数 tcflush 用 于 清空 输入 、 和 输出 或 者 两 者 都 清空 。 

我 们 已 介绍 完了 termios 结 构 ， 下 和 面 来 看 几 个 实用 的 例子 。 其 中 最 简 
ee I es 通过 关闭 ECHO 标 志 即 可 做 到 这 


实 验 使 用 termios 结 构 的 密码 程序 
(1) 密码 程序 password.c 以 下 面 的 定义 开始 : 


struct termios initialrsettings, newrsettings 
IORD_LEN + 1); 


(2) 接 下 来 ， 增 加 一 行 语句 来 获取 标准 输入 的 当前 设置 ， 并 把 这 
些 值 保 存 到 刚才 创建 的 termios 结 构 中 : 


(3) 对 原始 的 设置 值 做 一 份 副 本 以 便 在 程序 结束 时 还 原 设 置 。 在 
termios 结 构 变量 newrsettings 中 关闭 ECHO 标志 ， 然 后 提示 用 户 输入 密 
但 : 


ewrsettings = initialrsettings; 
newrsettings.c_lflag &= ~ECHO; 


(4) 接 下 来 ， 用 newrsettings 变 量 中 的 值 设 置 终端 属性 并 读 取 用 户 
输入 的 密码 。 最 后 ， 将 终端 属性 还 原 到 原来 的 样子 并 输出 刚才 读 取 的 密 
码 ， 但 这 让 刚才 的 努力 都 “日 费 * 了 “这 只 是 为 了 说 明 回 显 功 能 恢复 了 ， 
在 实际 程序 中 不 要 输出 密码 ) 。 


n TCSAFLUSH, &nmewrsettings) != 0 


运行 这 个 程序 ， 你 将 看 到 如 下 的 输出 : 
$ ./password 

Enter password: 

You entered hello 


$ 

实验 解析 

在 这 个 例子 中 ， 用 户 输入 hello， 但 在 Enter password: 提示 符 后 并 不 
显示 用 户 输入 的 内 容 ， 直 到 用 户 按 下 回 车 键 后 程序 才 有 和 输出。 

请 注意 只 修改 你 需要 修改 的 标志 ， 使 用 的 语法 结构 是 X&= 
~FLAG〔 它 的 作用 是 清除 变量 Xx 中 由 FLAG 标 志 定 义 的 比特 ) 。 如 果 需 
要 ， 你 可 以 用 语法 结构 X | = FLAG 对 由 FLAG 标 志 定 义 的 单个 比特 进行 
置 位 ， 虽 然 在 上 面 的 例子 中 并 不 需要 这 样 做 。 

在 设置 终端 属性 时 ， 你 用 TCSAFLUSH 丢 弃 用 户 在 程序 准备 好 读 取 
数据 之 前 输入 的 任何 内 容 。 这 样 的 处 理 方式 是 为 了 培养 用 户 的 一 个 好 习 
惯 ， 即 在 回 显 功能 关闭 之 前 不 要 试图 输入 自己 的 密码 。 在 程序 结束 之 
前 ， 你 还 恢复 了 终端 的 原始 设置 。 

termios 结 构 的 另 一 种 常见 用 法 是 ， 将 终端 设置 为 这 样 一 种 状态 : 一 
旦 输入 字符 ， 程 序 就 立刻 读 取 它 。 这 是 通过 关闭 标准 模式 并 结合 使 用 
MIN 和 TIME 设 置 来 实现 的 。 


K 验 读 取 每 个 字符 

利用 新 学 到 的 知识 ， 你 可 以 对 沫 单程 序 做 一 些 修改 。 下 面 的 程序 
menu4.c 基 于 menu3.c， 它 在 后 者 中 插入 了 许多 来 自 password.c 中 的 代 
码 。 修 改 的 内 容 以 阴影 显示 ， 并 在 下 面 的 步骤 中 进行 了 解释 。 
(1) 在 程序 的 开始 ， 必 须 包 含 一 个 新 的 头 文件 : 


ude <termiog.h> 


char *menu[] = { 
"a - add new record", 
"d - delete record", 
"a - quit", 
NULL, 


Ee BTR, ihe fi maine 数 中 声明 一 些 新 变量 : 


getchoiceichar *greet, c ices LE *in, FILE *out) 
nt main 

int choice 

FILE *inpu 

PILE *outp 


struct termios initial_settings, new_settings; 


(3) 在 调用 getchoice 函 数 之 前 ， 需 要 改变 终端 的 特性 ， 插 入 下 面 
x EY a 


[tisatty[fileno(stdout 


fprintf(stderr, "You are not a terminal, OK.\n*}; 
np open (*/dev/tty r 
utpurt fopen (* /Ge y w") 
inp tout 
fprin der nable pe de yn 
exit(l 


tegetattr(fileno(input) ,@initial settings) ; 

new_settings = initial_settings; 

new_settings.c_lflag &= ~ICANON; 

new_settings.c_lflag &= ~ECHO; 

new_settings.c_cc(VMIN]) = 1; 

new_settings.c_cc[VTIME) = 0; 

new_settings.c_lflag &= ~ISIG; 

if(tcsetattr(fileno(input), TCSANOW, &new_settings) != 0) { 
fprintf(stderr, “could not set attributes\n"); 

} 


a 在 退出 程 友之 前 ， 还 需要 将 终端 属性 还 原 为 原来 的 值 : 


choice = getchoice("Please select an action, menu. input, output); 
printt(*You have = sen: $c + Choice}; 

) while (choice != ' 

tesetattr| fi Fae ,TCSANON, «initial settings); 

exit(d); 


(5) 由 于 在 非 标准 模式 下 ， 默 认 的 回 车 和 换行 符 之 间 的 映射 已 不 
存在 了 ， 所 以 需要 对 回 车 符 Y 进 行 检查 。 


int getchoice(char “greet, char *choices[], FILE *in, FILE *out) 
{ 

int chosen = 0; 

int selected; 


elected = fgetc(in); 
) while (selected == '\n' || selected == ‘\r'); 
A as SA 


除非 你 做 出 安排 ， 人 否则 ， 当 用 户 按 下 Ctrl+C 组 合 键 时 ， 程 序 将 终 
止 。 你 可 以 通过 在 本 地 模式 下 清除 ISIG 标 志 来 禁用 对 这 些 特殊 字符 的 处 
理 。 要 做 到 这 一 点 ， 你 需要 在 main 函 数 中 增加 如 下 一 条 语句 ， 如 前 面 的 
步 又 所 示 : 


new_settings.c_lflag &= ~ISIG; 


BORG KEE BLAS REP, MUR BEAD BBA ET IL Ze AIFS 
PREP HIM DY, 1 AAP Be A A 2 ET. 


S ./menu4 

Choice: Please select an action 
a - add new record 

d - delete record 

q - quit 

You have chosen: a 

Choice: Please select an action 
a - add new record 

d - delete record 


q - quit 
You have chosen: q 
$ 


如 果 按 下 组 合 键 Ctl+C， 它 将 被 直接 传递 给 程序 ， 并 被 程序 认为 是 
一 个 不 正确 的 菜单 选择 。 


5.5 终端 的 输出 


通过 使 用 termios 结 构 ， 你 可 以 控制 键盘 的 输入 。 但 我 们 希望 对 程序 
输出 到 屏幕 上 的 内 容 也 能 具有 同样 的 控制 能 力 。 在 本 章 的 一 开始 ， 你 用 
printf 函 数 将 字符 输出 到 屏幕 上 ， 但 还 没有 办 法 将 输出 的 内 容 放置 到 屏 
幕 上 的 特定 位 置 。 


5.5.1 28 vin HAS AY 


许多 UNIX 系 统 都 是 通过 终端 来 使 用 的 ， 虽 然 如 今 在 很 多 情况 
F, “终端 ?可 能 实际 上 只 是 在 PC 上 运行 的 一 个 终端 仿真 程序 或 者 是 窗口 
环境 中 的 一 个 终端 应 用 程序 ， 比 如 X11 中 的 xterm。 

历史 上 ， 不 同 的 制造 广 商 生产 了 大 量 的 各 种 类 型 的 硬件 终端 。 虽 然 
它们 几乎 都 用 escape 转 义 序 列 〈 以 escape 字 符 开 头 的 字符 串 ) 来 控制 光 
标的 位 置 和 终端 的 其 他 属性 比如 黑体 和 闪烁 等 ， 但 在 具体 实现 手段 
上 并 没有 统一 的 标准 。 某 些 陈旧 的 终端 还 使 用 不 同 的 卷 屏 方式 ， 这 将 导 
C a a 


escape 转 义 序 列 有 一 个 ANSI 标 准 ， 它 以 数字 设备 公司 (DECA 
司 ) 的 VT 系 列 终端 所 使 用 的 转 义 序列 为 基础 ， 但 并 不 完全 一 致 。 
许多 软件 终端 程序 提供 了 对 标准 人 硬件 终端 如 VT100、VT220、ANSI 
等 的 仿真 功能 。 


对 程序 员 来 说 ， 如 果 他 希望 编写 一 个 可 以 控制 屏幕 输出 的 软件 ， 并 
且 能 够 运行 在 各 种 类 型 的 终端 之 上 ， 则 硬件 终端 的 多 样 性 是 程序 员 要 面 
对 的 一 个 主要 问题 。 例 如 ，ANSI 终 端 使 用 转 义 序列 Escape,LA 将 光标 移 
动 到 上 一 行 ， 而 ADM-3a 终 端 (多 年 前 它 是 一 种 很 常见 的 终端 ) 只 需 使 
用 一 个 控制 字符 Ctrl+K 就 可 以 完成 这 一 任务 。 

编写 能 够 应 付 连接 到 UNIX 系 统 上 的 各 种 不 同类 型 终端 的 程序 ， 看 
上 去 是 一 项 非常 让 人 贞 慢 的 任务 。 这 样 的 程序 必须 针对 每 种 类 型 的 终端 
编写 相应 的 代码 。 

让 人 欣慰 的 是 ，terminfo 软 件 包 的 出 现 解 决 了 这 一 问题 。 程 序 不 再 
需要 去 迎合 每 种 类 型 的 终端 ， 取 而 代 之 的 是 ， 程 序 通 过 查询 终端 类 型 数 
据 库 来 找到 正确 的 终端 信息 。 在 大 多 数 现代 UNIX 系 统 〈 包 括 Linux ) 
中 ， 这 个 软件 包 和 另 一 个 软件 包 curses 集 成 在 一 起 。 你 将 在 下 一 章 学 习 


后 者 


为 了 使 用 terminfo 函 数 ， 你 通常 需要 在 程序 中 包括 curses 头 文件 
curses.h 和 terminfo 自 己 的 头 文件 term.h。 在 一 些 Linux 系 统 上 ， 你 可 能 不 
得 不 使 用 被 称 为 ncurses 的 curses 实 现 ， 并 在 程序 中 包括 ncurses.h 头 文件 
以 提供 对 terminfo 函 数 的 原型 定义 。 


5.5.2 识别 终端 类 型 


Linux 环 境 包含 一 个 变量 TERM， 它 的 值 被 设置 为 当前 正在 使 用 的 终 
端 类 型 。 这 通常 是 由 系统 在 用 户 登 录 时 自动 设置 的 。 系 统管 理 员 可 以 针 
对 每 个 直接 连接 的 终端 设置 默认 的 终端 类 型 ， 对 于 通过 网 络 远 程 连 接 的 
用 户 ， 可 以 提示 用 户 选 择 自己 的 终端 类 型 。TERM 环 境 变 量 的 值 可 以 通 
过 telnet 进 行 协商 ， 并 由 rlogin 程 序 进行 传递 。 

用 户 可 以 通过 查询 shell 来 了 解 ， 从 系统 的 角度 看 自己 正在 使 用 的 终 
端 是 何 种 类 型 的 ; 

$ echo STERM 


xterm 


` 

在 这 个 例子 中 ，shell 是 通过 xterm 程 序 〈 一 个 X 视 窗 系 统 中 的 终端 仿 
真 程序 ) 或 是 提供 类 似 功能 的 程序 〈 如 KDE 的 Konsole 或 GNOME 的 
gnome-terminal ) 运行 的 。 

terminfo 软 件 包 包含 一 个 由 大 量 不 同类 型 终端 的 功能 标志 和 escape 转 
义 序 列 等 信息 构成 的 数据 库 ， 并 且 为 使 用 它们 提供 了 一 个 统一 的 编程 接 
口 。 一 个 使 用 这 个 软件 包 的 程序 能 够 随 着 数据 库 的 扩展 来 适应 未 来 的 终 
端 类 型 ， 对 不 同类 型 终端 的 支持 不 再 需要 由 应 用 程序 自身 来 提供 。 

terminfo 的 功能 标志 由 属性 接 述 ， 它 们 被 保存 在 一 组 编译 好 的 
terminfo 文 件 中 ， 这 些 文件 通 常 可 以 在 /usr/lib/terminfo 
或 /usrshare/terminfo 目 录 中 找到 。 每 个 终端 〈 包 括 许多 不 同类 型 的 打印 
机 ， 它 们 也 可 以 通过 terminfo 来 定义 ) 都 有 一 个 定义 其 功能 标志 和 如 何 
访问 其 特征 的 文件 。 为 避免 创建 一 个 很 大 的 目录 ， 真 正 的 文件 都 保存 在 
下 一 级 的 子 目 录 中 ， 子 目录 名 就 是 终端 类 型 名 的 第 一 个 字母 。 例 如 ， 
VT100 终 端的 定义 束 放 在 文件 ...terminfo/v/vt100 中 。 

每 个 终端 类 型 对 应 一 个 terminfo 文 件 ， 文 件 格 式 是 可 读 的 源 代 码 ， 
然后 通过 tic 命 令 将 源 文件 编译 为 更 加 紧凑 、 有 效 的 格式 ， 以 方便 应 用 程 
序 的 使 用 。 奇 怪 的 是 ，X/Open 规 范 提 到 了 源 文件 和 编译 格式 的 定义 ， 但 


却 未 提 到 把 源 文件 转换 为 编译 格式 的 tic 命 令 。 你 可 以 用 infocmp 程 序 输 
出 已 编译 terminfo 数 据 项 的 可 读 版 本 。 
下 面 是 VT100 终 端 对 应 的 terminfo 文 件 的 样本 : 


每 个 terminfo 定 义 由 3 种 类 型 的 数据 项 组 成 。 每 个 数据 项 被 称 为 
capname， 它 们 分 别 用 于 定义 终端 的 一 种 功能 标志 。 

布尔 功能 标志 指出 终端 是 否 支 持 某 个 特定 的 功能 。 例 如 ， 如 果 终 端 
支持 XON/XOFF 流 控 ， 则 在 该 终端 对 应 的 terminfo 文 件 中 定义 布尔 功能 
标志 xon。 

数值 功能 标志 定义 长 度 ， 例 如 : lines 定 义 的 是 屏幕 上 可 以 显示 的 行 
数 ，cols 定 义 的 是 屏幕 上 可 以 显示 的 列 数 。 具 体 数 字 和 功能 标志 名 之 间 
用 字符 # 隔 开 。 如 果 要 定义 一 个 有 80 列 24 行 显示 范围 的 终端 ， 可 以 写 为 
cols#80, lines#24. 

字符 串 功能 标志 稍微 复杂 一 些 。 它 用 来 定义 两 种 截然 不 同 的 终端 功 
能 : 用 于 访问 终端 功能 的 输出 字符 串 和 当 用 户 按 下 特定 按键 〈 通 常 是 功 
能 键 或 在 数字 小 键盘 上 的 特殊 键 ) 时 终端 接收 到 的 输入 字符 串 。 有 些 字 
符 串 功能 标志 非常 简单 ， 例 如 el 表示 “删除 到 行 尾 "。 在 VT100 终 端 上 ， 
用 于 完成 这 一 功能 的 escape 转 义 序列 是 Esc,[,K， 在 terminfo 源 文件 中 写 为 
el=\E[K. 

特殊 键 的 定义 也 采用 类 似 的 方法 。 例 如 ，VT100 终 端 上 的 F1 功 能 键 
发 送 的 escape 转 义 序列 是 Esc O,P， 它 被 定义 为 kfl=\EOP。 

当 escape 转 义 序列 本 身 还 需要 带 有 参数 时 ， 情 况 会 变 得 更 加 复杂 。 
大 多 数 终端 都 能 将 光标 移动 到 一 个 特定 的 行列 位 置 。 很 明显 ， 为 光标 可 
能 移动 到 的 每 个 位 置 定 义 一 个 功能 标志 是 不 现实 的 ， 解 决 方法 是 使 用 一 
个 通用 的 字符 串 功能 标志 ， 在 使 用 这 个 字符 串 时 ， 通 过 插入 参数 来 确定 
光标 要 移动 到 的 确定 位 置 。 例 如 ，VT100 终 端 通过 转 义 序列 Esc， [, 


<row>,;,<col>,H 将 光标 移动 到 一 个 特定 位 置 。 在 terminfo 源 文件 中 ， 它 

被 写 为 相当 复杂 的 字符 串 cup=\E[%i%pl%d;%p2%dH$<5>。 
下 面 给 出 了 它 的 含义 。 

\E: 发 送 Escape 字 符 。 

[: 发 送 [字符 。 

%i: 增加 参数 值 。 

%pl: 将 第 一 个 参数 放 入 栈 。 

%d: 将 栈 上 的 数字 输出 为 一 个 十 进 制 数 。 

%p2: 将 第 二 个 参数 放 入 栈 。 

%d: 将 栈 上 的 数字 输出 为 一 个 十 进 制 数 。 

H: 发 送 H 字 符 。 

这 种 写法 看 起 来 非常 复杂 ， 但 它 允 许 参 数 以 固定 的 顺序 排列 ， 与 终 
端 期 望 它们 出 现在 最 终 escape 转 义 序 列 中 的 顺序 无 关 。%i 的 作用 是 增加 
参数 的 值 ， 它 是 必 不 可 少 的 ， 因 为 标准 的 光标 寻 址 方法 是 将 屏幕 的 左上 
角 看 做 是 (0,0) ， 而 VT100 终 端 把 这 个 位 置 定 义 为 〈11) 。 最 后 的 
$<5> 表 示 需 要 延迟 一 段 时 间 ， 访 时间 的 长 度 为 输出 五 个 字符 所 花费 的 时 
间 ， 终 端 将 利用 这 段 时 间 来 处 理光 标的 移动 。 


我 们 可 以 上 自己 定义 许多 功能 标志 ， 但 羊 运 的 是 ， 大 多 数 UNIX 
和 Linux 系 统 已 经 预定 义 好 了 大 部 分 终端 的 功能 标志 。 如 采 需 要 增 
加 一 个 新 终端 ， 你 可 以 在 terminfo 的 手册 页 中 找到 完整 的 功能 标志 
列表 。 一 种 比较 好 的 方法 是 首先 找到 与 新 终端 类 似 的 一 个 终端 ， 以 
它 为 出 发 点 ， 将 新 终端 定义 为 这 个 已 有 终端 的 变 体 ， 或 者 逐个 对 新 
终端 的 功能 标志 进行 定义 ， 按 需要 修改 它们 。 


除了 terminfo 的 手册 页 以 外 ， 你 还 可 以 参考 由 O?Reilly 出 版 的 
Termcap and Terminfo 〈 作 者 是 John Strand, Linda Mui 和 Tim) 。 


口 口 口 口 口 口 口 口 口 


5.5.3 terminfo 功 能 标志 


现在 ， 你 已 知道 如 何 定 义 终 端的 功能 标志 ， 你 还 需 知道 如 何 访问 它 
们 。 当 使 用 terminfo 时 ， 你 要 做 的 第 一 件 事 情 就 是 调用 函数 setupterm 来 
设置 终端 类 型 ， 这 将 为 当前 的 终端 类 型 初始 化 一 个 TERMINAL 结 构 。 然 
后 ， 你 就 可 以 查看 当前 终 症 的 功能 标志 并 使 用 它们 的 功能 了 。setupterm 
函数 的 调用 方法 如 下 所 示 : 


#include <term.h> 


int setupterm(char *term, int fd, int *errret); 


setupterm 库 函数 将 当前 终端 类 型 设置 为 参数 term 指 癌 的 值 ， 如 果 
term 是 空 指针 ， 就 使 用 环境 变量 TERM 的 值 。 参 数 fd 为 一 个 打开 的 文件 
描述 符 ， 它 用 于 辐 终 端 写 数 据 。 如 果 参 数 errret 不 是 一 个 空 指针 ， 则 函数 
的 返回 值 保 存在 该 参数 指 同 的 整 型 变量 中 ， 下 面 给 出 了 可 能 写 入 的 值 。 

口 “-1:terminfo 数 据 库 不 存在 。 

O 0:terminfo 数 据 库 中 没有 匹配 的 数据 项 。 

O 1: 成 功 。 

setupterm 函数 在 成 功 时 返回 常量 OK， 失 败 时 返回 ERR。 如 果 errret 
被 设置 为 空 指 针 ，setupterm 函 数 会 在 失败 时 输出 一 条 诊断 信息 并 导致 程 
序 直 接 退 出 ， 束 像 下 面 这 个 例子 : 


#include <stdio.h> 
@include <term.h> 


include <stdlib.h> 


setup term(*unlisted*, fileno(stdout), (int *)0) 


在 你 的 系统 中 运行 这 个 程序 的 结果 可 能 和 这 里 给 出 的 不 完全 一 样 ， 
但 含义 是 很 清楚 的 。 字 符 串 Done 不 会 输出 ， 因 为 setupterm 函 数 会 在 执行 
失败 时 导致 程序 直接 退出 。 


$ cc -o badterm badterm.c -lncurses 
$ ./badterm 
‘unlisted': unknown terminal type. 
$ 
请 注意 这 个 例子 中 的 编译 命令 行 : 在 这 个 Linux 系 统 上 ， 我 们 使 用 
的 是 curses 函 数 库 的 ncurses 实 现 ， 并 使 用 位 于 标准 位 置 的 标准 头 文 件 。 
在 这 类 系统 上 ， 你 可 以 直接 在 程序 中 包含 curses.h 头 文件 ， 并 在 编译 时 
为 库 文件 指定 -Incurses 选 项 。 
对 于 菜单 选择 函数 来 说 ， 你 希望 它 能 够 首先 清 屏 ， 然 后 在 屏幕 上 移 
动 光 标 并 将 数据 写 到 屏幕 的 不 同位 置 。 在 成 功 调用 setupterm 函 数 后 ， 你 
即 可 通过 如 下 3 个 函数 调用 来 访问 terminfo 的 功能 标志 ， 每 个 函数 对 应 一 
个 功能 标志 类 型 : 


#include <term.h> 


int tigetflag(char *capname) ; 
int tigetnum(char *capname) ; 
char *tigetstr(char *capname) ; 


函数 tigetflag、tigetnum 和 tigetstr 分 别 返 回 terminfo 中 的 布尔 功能 标 
志 、 数 值 功能 标志 和 字 Bip. FC Collen, FES A 7 
志 不 存在 ) tigetflag K AIR tigetnumef BUI [A]-2,  tigetstrek BOK 
(char *) -1。 
你 可 gal aloe ens aetna 及 终端 nit ea A, 下 面 的 程 
序 sizeterm.c 通 过 获取 cols 和 lines 功 能 标志 来 实现 这 一 功能 


fincl lude <stdio.h> 
Sinclude <term.h> 
ti ade <curses .h> 


dine lude <avdlib b> 


int sain() 
f 


int nrows, ncolumns; 
setupterm(NULL, fileno(stdout), (int *)0 
tigetnus 
umr tigetnum ls*); 
is terminal has td columns and #4 rows\n", ncolumns, nrows); 


echo $TERM 


-/sizeterm 


如 末 在 一 全 工作 站 的 一 个 寡 口 中 运行 这 个 程序 ， 输 出 结果 将 反映 当 
前 窗口 的 大 小 ， 如 下 所 示 : 
$ echo $TERM 
xterm 
$ ./sizeterm 
This terminal has 88 columns and 40 rows 


¢ 
~ 


如 果 用 tigetstr 函 数 来 获取 xterm 终 端 类 型 的 光标 移动 功能 标志 cup 的 
值 ， 你 将 会 得 到 一 个 参数 化 的 结果 \E[%pl%d;%p2%dH。 

这 个 功能 标志 需要 两 个 参数 : 光标 要 移动 到 的 行 号 和 列 号 。 这 两 个 
坐标 都 是 从 0 开始 计算 的 ，〈0,0) 表示 屏幕 的 左上 角 。 

你 可 以 使 用 tparm 函 数 用 实际 的 数值 蔡 换 功能 标志 中 的 参数 ， 一 次 
最 多 可 以 蔡 换 9 个 参数 ， 并 返回 一 个 可 用 的 escape 转 义 序 列 。 该 函数 的 定 


义 如 下 : 


#include <term.h> 


char *tparm(char *cap, long pl, long p2, ..., long p9); 


当 用 tparm 函 数 构造 好 终端 的 escape 转 义 序 列 后 ， 你 必须 将 其 发 送 到 
终端 。 要 想 正确 地 完成 这 一 操作 ， 你 不 能 通过 printf 函 数 将 字符 串 发 送 
到 终端 ， 而 必须 使 用 系统 提供 的 如 下 儿 个 特殊 函数 ， 这 些 函 数 可 以 正确 
地 处 理 终端 完成 一 个 操作 上 需要 的 延 时 : 

#include <term.h> 


int putp(char *const str); 
int tputs(char *const str, int affcnt, int (*putfunc) (int)); 


putpPA aE IAIN IK IIOK, AUUINIKIFIERR. EUSA sire Fl] 
符 串 为 参数 ， 并 将 其 发 送 到 标准 输出 stdout。 

所 以 ， 如 果 要 将 光标 移动 到 屏幕 上 的 第 5 行 第 30 列 ， 你 可 以 使 用 如 
下 代码 段 : 


cup"); 
sequence = tparm(cursor,5,30); 
esc sequence); 


tputs 函 数 是 为 不 能 通过 标准 输出 stdout 访 问 终端 的 情况 准备 的 ， 它 
可 以 指定 一 个 用 于 输出 字符 的 函数 。tputs 函 数 的 返回 值 是 用 户 指定 的 函 
数 putfunc 的 返回 结果 。 参 数 affcnt 的 作用 是 表明 受 这 一 变化 影响 的 行 
数 ， 它 一 般 被 设置 为 1。 真 正 用 于 输出 控制 字符 串 的 函数 的 参数 和 返回 
值 类 型 必须 与 putchar 函 数 相同 。 事 实 上 ， 函 数 调用 putp (string) WE] 
于 函数 调用 tputs (string, 1, putchar) 。 在 下 一 个 例子 中 ， 你 将 看 到 tputs 
函数 使 用 用 户 指定 的 输出 函数 的 情况 。 

注意 ， 一 些 老 版 本 的 Linux 将 tputs 函 数 的 最 后 一 个 参数 定义 为 
int (*putfunc ) (char) ， 如 果 是 这 样 ， 你 就 必须 修改 下 面 实 验 中 的 
char to_terminal 函 数 的 定义 。 


如 果 通 过 手册 页 查找 与 parm 函 数 以 及 终端 功能 标志 相关 的 信 
息 ， 你 可 能 会 看 到 函数 tgoto。 用 该 函数 来 移动 光标 会 更 加 简单 ， 但 
我 们 并 未 使 用 它 ， 原 因 是 在 1997 年 版 的 X/Open 规范 (单一 UNIX 规 
范 版 本 2) 中 并 未 包含 该 函数 的 定义 。 因 此 ， 我 们 建议 读者 在 新 编 
写 的 程序 中 也 不 要 使 用 这 类 函数 。 


问 荣 单 选 择 函 数 里 添加 屏幕 处 理 功能 的 准备 工作 已 基本 就 绪 ， 现 在 


唯一 未 提 到 的 就 是 清 屏 操作 。 这 一 操作 可 以 通过 使 用 clear 功 能 标志 来 完 
成 ， 它 首先 清 屏 ， 然 后 将 光标 放 到 屏幕 的 左上 角 。 但 有 些 终端 并 不 文 持 
clear 功 能 标志 ， 此 时 ， 你 需要 首先 将 光标 移动 到 屏幕 的 左上 角 ， 然 后 使 
用 命令 ed (delete to end of display， 删 除 到 显示 区 域 结尾 ) 。 

将 上 面 这 些 内 容 结合 在 一 起 ， 你 将 编写 样本 沫 单程 序 的 最 终 版 本 
Screenmenu.c， 它 将 把 荣 单 选项 “ 画 ? 在 屏幕 上 供用 户 选 择 。 


实 验 完整 的 终端 控制 

你 可 以 重新 编写 menu4.c 中 的 getchoice 函 数 以 提供 完整 的 终端 控制 
功能 。 在 下 面 的 程序 清单 中 ， 我 们 省 略 了 main 函 数 ， 因 为 无 需 对 其 进行 
修改 。 其 他 与 menu4.c 不 一 致 的 地 方 都 以 灰色 背景 显示 。 


finclude <term.h> 


finclude <curses.h> 
a tg tream (FILE 
ha hoices | ILE 
nt rm char_to_write) 
e(char *greet, char *choices[), FILE *in, FILE ‘out 
int chosen 
int selected; 
screen encol 0 


p strea 
t mi(NULL n 

r tige r up*) 
ea igets ear 


tpute(tparm(cursor, screenrow, screencol), 1, char to terminal); 


topti 
0 pt one 
if(!tchose: { 
tputs “fara cursor, screenrow, screencol), 1, char_to_terminal); 
tprintf (oc *Incorrec “chloe, select again\n* 


} while(!chosen); 
tputs(clear, 1, char_to_terminal); 


return selected; 
) 
int char_to_terminal(int char_to_write) 
{ 
if (output_stream) putc(char_to_write, output_stream); 
return 0; 


将 这 个 程序 保存 为 menu5.c。 

实验 解析 

重新 编写 的 getchoice 隙 数 实现 的 菜单 内 容 与 前 面 的 例子 完全 一 样 ， 
但 其 屏幕 输出 部 分 进行 了 修改 以 充分 利用 terminfo 的 功能 标志 。 在 用 户 
进行 下 一 次 选择 前 ， 程 序 会 有 清 屏 操 作 ， 如 果 想 在 清 屏 之 前 让 信息 You 
have chosen: 在 屏幕 上 多 停留 一 会 儿 ， 你 可 以 在 main 函 数 中 增加 一 条 调 
有 数 的 语句 ， 如 下 所 示 : 


-NOlCe getchoicel "Please select an action’ menu input, utput 


sleep{1); 


这 个 程序 里 的 最 后 一 个 函数 char to_terminal 包 含 了 对 putc 函 数 的 调 
用 ， 我 们 将 在 第 3 章 介 绍 putc 函 数 。 为 使 本 章 内 容 更 加 完整 ， 我 们 再 看 


一 个 如 何 检测 用 户 击 键 动 作 的 程序 示例 。 


5.6 AMIR 


曾经 为 MS-DOS 编 写 程序 的 人 们 经 常会 在 Linux 系 统 中 寻找 一 个 与 
kbhit 函 数 等 同 的 函数 ，kbhit 函 数 可 在 没有 实际 进行 读 操 作 之 前 检测 是 否 
某 个 键 被 按 过 。 遗 憾 的 是 ， 他 们 找 不 到 这 样 的 函数 ， 因 为 Linux 系 统 中 
没有 与 其 直接 等 同 的 函数 。 但 UNIX 程 序 员 对 此 并 不 在 意 ， 因 为 在 UNIX 
下 编写 的 程序 几乎 不 或 很 少 忙于 等 待 某 个 事件 的 发 生 。 由 于 kbhit 函 数 的 
主要 用 途 就 是 等 待 某 个 击 键 动作 的 发 生 ， 所 以 在 UNIX 和 Linux 系 统 上 未 
实现 类 似 的 函数 。 

但 当 需 要 移植 MS-DOS 下 的 程序 时 ， 如 果 能 够 模拟 kbhit 函 数 所 完成 
的 功能 将 会 很 方便 。 你 可 以 用 非 标 准 输 入 模式 来 实现 它 。 


实 验 你 自己 的 kbhit 函 数 

C1) 程序 开始 是 标准 的 程序 头 和 一 组 对 终端 设置 结构 的 声明 ， 变 
量 peek_character 将 用 在 测试 击 键 动 作 的 代码 中 ， 然 后 是 程序 后 面 会 用 到 
的 一 些 函数 的 原型 定义 。 


onan «= 
be be pa be be 
SoD 


(2) main 函 数 首先 调用 init_ keyboard 函 数 来 配置 终端 ， 然 后 每 隔 一 
秒 循环 调用 一 次 kbhit 函 数 。 如 果 按 键 为 qg， 就 退出 循环 并 调用 
close_keyboard 函 数 恢复 终端 为 标准 模式 ， 最 后 退出 程序 。 


printf (*looping\n*); 
sleep(l); 
if(kbhic()) ( 
ch = readch(); 
rintf(*you hit te\n*,ch); 


} 


close_keyboard(); 
exit(0); 


(3) init_ keyboard 函 数 和 close_keyboard 函 数 分 别 在 程序 的 开始 和 
结束 对 终端 进行 配置 。 


void init_keyboard() 

{ 
tegetattr(0,é&initial settings) ; 
new_settings = initial_settings; 
new_settings.c_lflag &= ~ICANON; 
new_settings.c_lflag &= ~ECHO; 
new_settings.c_lflag &= ~ISIG; 
new_settings.c_cc[VMIN] = 1; 
new_settings.c_cc[VTIME] = 0; 
tesetattr(0, TCSANOW, &mew_settings); 

) 

void close_keyboard() 

{ 
tesetattr(0, TCSANOW, sinitial_ settings); 


(4) 下 面 就 是 检测 是 否 有 击 键 动 作 的 kbhit 函 数 : 


int kbhit(} 


} 


char ch; 
int nread; 


if(peek_character != -1) 


return 1; 
new_settings.c_cc[VMIN]=0; 
tesetattr(0, TCSANOW, &new_settings); 


nread = read(0,éch,1); 
new_settings.c_cc[VMIN]=1; 
tesetattr(?, TCSANOW, &new_settings); 


if{mread == 1) | 
peek_character = ch; 
return 1; 

) 


return 0; 


(5) 按键 对 应 的 字符 由 下 一 个 函数 readch 读 取 ， 它 会 将 变量 
peek_character 重 置 为 -1 以 进入 下 一 次 循环 。 


int readch1) 
{ 


char ch; 


if{peek_character != -1) { 
ch = peek character; 
peek_character = -1; 
return ch; 

} 

read(0,&ch,1); 

return ch; 


运行 这 个 程序 ， 你 将 看 到 如 下 的 输出 结果 : 
$ 


. /kbhit 

looping 

looping 

looping 

you hit h 

looping 

looping 

looping 

you hit d 

looping 

you hit q 

> 

实验 解析 

init_keyboard 函 数 将 终端 配置 为 "read 调用 直到 有 字符 可 以 读 取 时 才 
返回 ”的 工作 模式 〈MIN=1， TIME=0) 。kbhit 函 数 将 这 个 模式 修改 
为 "read 调用 检查 输入 并 立刻 返回 ”的 工作 模式 (MIN=0，TIME=0) 。 最 
后 ， 在 程序 退出 前 恢复 终 病 的 初始 设置 。 

注意 ， 在 kbhit 函 数 中 ， 你 实际 上 已 将 按键 对 应 的 字符 读 取 了 ， 但 它 
只 在 需要 时 才 通 过 readch 函 数 返 回 。 


5.7 ”虚拟 控制 台 


Linux 提 供 了 虚拟 控制 台 的 功能 ， 一 组 终端 设备 共享 PC 电脑 的 屏 
幕 、 键 盘 和 鼠标 。 通 常情 况 下 ， 一 个 Linux 安 装 将 配置 8 个 或 12 个 虚拟 控 
制 台 。 虚 拟 控制 台 通 过 字符 设备 文件 /dewttyN 使 用 ， 其 中 N 代 表 一 个 数 
字 ， 从 1 开始 。 

如 果 使 用 字符 界面 登录 Linux 系 统 ， 在 Linux 启 动 并 运行 后 ， 你 首先 
会 看 到 一 个 login 提 示 符 ， 在 输入 用 户 名 和 密码 登录 后 ， 你 所 使 用 的 终端 
设备 就 是 系统 中 的 第 一 个 虚拟 控制 台 ， 即 终端 设备 /dev/tty1。 

使 用 命令 who 和 ps， 你 即 可 看 到 目前 登录 进 系统 的 用 户 ， 以 及 在 这 
个 虚拟 控制 台 上 运行 的 shell 和 执行 的 程序 : 


$ who 
neil ttyl Mar 8 18:27 
$ ps -e 
PID TTY TIME CMD 
1092 ttyl 00:00:00 login 
1414 ttyl 00:00:00 bash 
1431 ttyl 00:00:00 emacs 


你 可 以 看 到 用 户 neil 已 登录 进 系统 ， 并 在 虚拟 控制 台 /dewtty1 上 运行 
程序 emacs。 

Linux 系 统 通 常 在 前 6 个 虚拟 控制 台 上 运行 一 个 getty 进 程 ， 这 样 用 户 
即 可 用 同一 个 屏幕 、 键 盘 和 鼠标 在 6 个 不 同 的 虚拟 控制 台 上 登录 。 你 可 
以 用 ps 命令 看 到 getty 进 程 : 


$ ps -e 

PID TITY TIME CMD 

1092 ttyl 00:00:00 login 
1093 tty2 00:00:00 mingetty 
1094 tty3 00:00:00 mingetty 
1095 tty4 00:00:00 mingetty 
1096 tty5 00:00:00 mingetty 
1097 tty6 00:00:00 mingetty 


你 可 以 看 到 ，SuSE Linux 系 统 默认 的 getty 程 序 mingetty 运 行 在 另外 5 
个 虚拟 控制 台 上 ， 并 等 待 用 户 的 登录 。 


你 可 以 通过 一 个 特殊 的 组 合 键 Ctrl+Alt+F<N> 在 不 同 的 虚拟 控制 台 
之 间 进 行 切换 ， 其 中 N 是 你 希望 切换 到 的 虚拟 控制 台所 对 应 的 数字 。 例 
如 ， 如 果 想 切换 到 第 2 个 虚拟 控制 台 ， 你 就 按 下 组 合 键 Alt+Ctrl+F2， 按 
下 组 合 键 Ctrl+Alt+F1 将 返回 到 第 一 个 虚拟 控制 合 。 注意 : 当 在 字符 界 
面 而 不 是 图 形 界 面 进行 虚拟 控制 台 的 切换 时 ， 需 要 使 用 组 合 键 
AlttF<N> £1, ) 

如 果 Linux 系 统 使 用 的 是 图 形 登 录 界 面 ， 例 如 通过 startx 程 序 或 通过 
视窗 管理 器 xdm， X 视 窗 系统 将 使 用 第 一 个 未 使 用 的 虚拟 控制 合 ， 通 名 
是 /devwtty7。 在 使 用 X 视 窗 系统 时 ， 你 可 以 用 组 合 键 Ctrl+Alt+F<N> 切 换 
到 字符 控制 台 ， 用 组 合 键 Ctrlt+Alt+F7 切 换 回 X 视 窗 系 统 。 

你 可 以 同时 在 Linux 系 统 上 运行 多 个 X 视 窗 会 话 ， 如 下 所 示 : 


S startx -- :1 


Linux 将 在 下 一 个 未 使 用 的 虚拟 控制 台 上 启动 X 服 务 器 ， 在 此 例 中 ， 
下 一 个 未 使 用 的 控制 台 是 /dev/tty8， 然 后 ， 你 即 可 用 组 合 键 Ctrl+Alt+F8 
和 Ctrl+Alt+F7 在 两 个 虚拟 控制 台 之 间 进 行 切换 。 

在 其 他 方面 ， 虚 拟 控 制 台 的 行为 都 与 普通 硬件 终端 一 样 。 如 果 一 个 
进程 拥有 正确 的 权限 ， 它 即 可 打开 一 个 虚拟 控制 台 ， 采 用 与 读 写 普通 硬 
件 终 端 一 样 的 方式 对 其 进行 读 写 。 


5.8” 伪 终端 


许多 类 UNIX 系 统 ， 包 括 Linux， 都 有 一 个 被 称 为 伪 终 端的 功能 。 这 
些 终端 的 行为 与 我 们 在 本 章 所 用 的 终端 非常 相似 ， 唯 一 区 别 是 伪 终 端 没 
有 对 应 的 硬件 设备 。 它 们 可 以 用 来 为 其 他 程序 提供 终端 形式 的 接口 。 

例如 ， 两 个 象棋 程序 可 以 通过 伪 终 端 进行 对 奔 ， 尽 管 程序 本 身 是 为 
与 人 类 棋 手 通过 实际 终端 进行 对 弈 而 设计 的 。 这 需要 有 个 应 用 程序 作为 
中 介 ， 它 将 一 个 程序 的 棋子 走 法 传递 给 另 一 个 程序 ， 反 之 亦 然 。 中 介 程 
序 通 过 伪 终 端 来 欺骗 象棋 程序 ， 让 它 在 没有 实际 终端 的 情况 下 正常 运 
行 。 

过 去 ， 伪 终端 都 是 以 系统 特定 的 方式 实现 的 ， 但 现在 它们 已 被 合并 
到 单一 UNIX 规 范 中 ， 称 为 UNIX98 伪 终端 或 PTY。 


5.9 小结 


在 本 章 中 ， 你 学 习 了 对 终端 进行 控制 的 三 个 不 同方 面 。 在 本 章 的 第 
一 部 分 ， 你 学 习 了 如 何 检测 重 定 向 ， 如 何 直 接 与 终端 进行 对 话 ， 即 使 在 
标准 文件 描述 符 被 重 定 向 的 情况 下 。 你 了 解 了 终端 的 硬件 模型 及 其 历史 
演变 过 程 。 接 下 来 ， 你 学 习 了 通用 终端 接口 和 termios 结 构 ， 后 者 提供 了 
对 Linux 终 端 处 理 的 细节 控制 。 你 还 学 习 了 terminfo 数 据 库 及 其 相关 函数 
的 使 用 方法 ， 它 们 以 终端 独立 的 方式 来 管理 屏幕 输出 。 然 后 ， 你 学 习 了 
如 何 立 刻 检 测 用 户 的 击 键 。 最 后 ， 你 学 习 了 Linux 的 虚拟 控制 台 和 伪 终 
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己 英 文 单词 curse 是 咒语 的 意思 。 译 者 注 
JAXA newline also does a carriage return， 这 里 的 译文 是 参考 Linux 
在 线 帮助 手册 man termios 中 的 解释 ， 原 文 为 Don't output CR。 译 者 认为 
在 线 帮 助手 册 中 的 解释 更 清楚 。 译 痢 证 
也 原文 为 使 用 组 合 键 Ctrlt+F<N>， 似 有 误 ， 实 际 上 ， 在 使 用 字符 界面 
时 ， 最 常用 的 虚拟 控制 台 切 换 组 合 键 是 Alt+F<N>， 

一 一 译 者 注 
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在 第 5 章 中 ， 你 学 习 了 如 何 加 强 对 字符 输入 的 控制 ， 以 及 如 何以 
终端 无 关 的 方式 提供 字符 输出 。 使 用 通用 终端 接口 〈GTI 或 termios) 和 
通过 tparm 及 其 相关 函数 控制 escape 转 义 序列 都 存在 一 个 问题 ， 那 就是 它 
们 需要 使 用 大 量 的 底层 代码 。 对 大 多 数 程序 来 说 ， 它 们 更 需要 的 是 一 个 
高 层 接口 。 我 们 和 希望 能 够 简单 绘制 屏幕 ， 并 能 用 一 组 函数 自动 处 理 与 终 
端 相 关 的 问题 。 

在 本 章 中 ， 你 束 将 学 习 函 数 库 curses。curses 标 准 作为 一 个 重要 的 过 
渡 ， 位 于 简单 的 文本 行程 序 和 完全 图 形 化 界面 〈 一 般 也 更 难于 编程 ) 的 
X 视 窗 系 统 程序 (如 GTK+/GNOME 和 QUKDE ) 之 间 。Linux 还 提供 
svgalib 函 数 库 〈 一 个 底层 图 形 函 数 库 ) ， 但 它 并 不 是 UNIX 的 标准 函数 
库 ， 因 此 ， 在 其 他 类 UNIX 操 作 系 统 中 一 般 并 未 提供 该 函数 库 。 许 多 全 
屏幕 的 应 用 程序 都 使 用 curses 函 数 库 ， 它 易于 使 用 ， 并 且 提 供 了 终端 无 
关 的 方式 来 编写 全 屏幕 的 基于 字符 的 程序 。 在 编写 这 类 程序 时 ， 使 用 
curses 函 数 库 总 是 比 直接 使 用 escape 转 义 序 列 要 容易 得 多 。curses 还 可 以 
管理 键盘 ， 它 还 提供 了 一 种 简单 易 用 的 非 阻 塞 字 符 输 入 模式 。 

读者 可 能 会 发 现 ， 在 Linux 控 制 合 上 运行 本 章 中 的 一 些 例 子 时 ， 并 
不 总 是 能 够 获得 预期 的 效果 。 这 是 因为 ， 当 curses 函 数 库 和 控制 侣 终端 
定义 的 结合 出 现 偏 差 时 ， 使 用 curses 函 数 库 的 程序 的 输出 结果 就 会 有 些 
问题 ， 但 如 果 在 X 视 窗 系 统 的 xterm 窗 口中 运行 这 些 例 子 ， 其 输出 结果 就 
与 你 预期 的 完全 一 样 了 。 

本 章 将 介绍 以 下 几 方 面 的 内 容 : 

口 curses 函 数 库 的 使 用 

口 “curses 函 数 库 的 概念 

口 基本 的 输入 输出 控制 

口 多 窗口 的 使 用 


口 、keypad 模 式 的 使 用 

L 彩色 显示 

在 本 章 最 后 ， 我 们 将 用 C 语 言 重 新 实现 CD 唱片 管理 程序 ， 将 其 作为 
对 目前 为 止 所 学 知识 的 一 个 总 结 。 
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新 ， 从 而 也 减少 了 必须 加 字符 终端 发 送 的 字符 数目 。 虽 然 比 起 使 用 呈 终 
端 和 慢 速 调制 解 调 器 的 年 代 ， 输 出 字符 的 数量 已 显得 不 那么 重要 ,但 
curses 函 数 库 仍 是 程序 员工 具 箱 中 一 个 有 用 的 工具 。 

由 于 curses 是 一 个 函数 库 ， 所 以 在 需要 使 用 它 时 ， 你 必须 在 程序 中 
包 侣 对 应 的 头 文件 、 函 数 声 明和 宏 定 义 。curses 函 数 库 有 多 种 不 同 的 实 
现 版 本 ， 最 早 的 版 本 出 现在 BSD 版 本 的 UNIX 系 统 中 ， 后 来 被 集成 到 系 
统 V 风 格 的 UNIX 系 统 中 ， 其 后 义 由 X/Open 组 织 对 curses 进 行 了 标准 化 。 
Linux 使 用 的 curses 版 本 是 ncurses( 义 称 为 new curses) ， 它 是 在 Linux 系 
统 上 开发 的 、 针 对 系统 V 版 本 4.0 上 curses 函 数 库 的 免费 仿真 软件 。 这 个 
版 本 可 以 方便 地 移植 到 其 他 UNIX 版 本 中 ， 虽 人 然 它 还 包括 了 一 些 附加 的 
不 可 移植 的 功能 。 现 在 甚至 还 有 针对 MS-DOS 和 Windows 系 统 的 curses 版 
本 。 如 果 使 用 的 UNIX 系 统 自 带 的 curses 函 数 库 不 支持 某 些 功能 ， 你 可 以 
尝试 获取 一 份 ncurses 函 数 库 来 蔡 换 它 。Linux 用 户 通 常 都 会 发 现 系统 已 
预 装 好 了 ncurses 函 数 库 ， 或 至 少 安装 好 了 运行 基于 curses 函 数 库 的 程序 
所 需 的 组 件 。 如 果 ncurses 的 开发 函数 库 并 没有 在 Linux 发 行 版 中 预 装 
《系统 中 没有 头 文件 curses.h 或 用 于 链接 的 curses 库 文件 ) ， 它 们 通常 会 
以 一 个 标准 软件 包 的 形式 存在 于 大 多 数 主 要 的 Linux 发 行 版 中 ， 例 如 ， 
它 可 能 被 命名 为 libncurses5-dev。 


X/Open 规 范 定 义 了 两 个 级 别 的 curses 函 数 库 : 基本 curses 函 数 
库 和 扩展 curses 函 数 库 。 扩 展 curses 函 数 库 包 含 一 组 混杂 的 附加 函 
数 ， 比 如 处 理 多 列 字 符 和 控制 颜色 的 函数 。 除 在 本 章 的 后 面 会 讨 
论 颜 色 的 使 用 外 ， 我 们 主要 介绍 的 都 是 基本 curses 函 数 。 


当 对 使 用 curses 函 数 库 的 程序 进行 编译 时 ， 你 必须 在 程序 中 包含 头 
文件 cursesh， 并 在 编译 命令 行 中 用 -1curses 选 项 来 链接 curses 函 数 库 。 在 
许多 Linux 系 统 中 ， 你 可 以 直接 使 用 curses， 但 你 会 发 现实 际 使 用 的 是 更 
好 的 、 更 新 的 ncurses 实 现 版 本 。 

你 可 以 检查 自己 的 curses 的 配置 情况 ， 命 令 

Is -1 /usr/include/*curses.h 
用 来 查看 curses 头 文件 ， 命 令 


Is -1 /usr/lib/lib*curses* 


用 来 检查 库 文 件 。 如 果 发 现 头 文件 curses.h 和 ncurses.h 都 只 是 链接 文件 ， 
而 且 系 统 中 存在 一 个 ncurses 库 文件 ， 那 么 你 就 可 以 使 用 如 下 命令 来 编译 
本 章 中 的 程序 : 

$ gcc program.c -o program -lcurses 

但 如 果 curses 配 置 并 未 上 自动 使 用 ncurses 函 数 库 ， 那 么 你 可 能 不 得 不 
在 程序 中 明确 包含 头 文件 ncurses.h 而 不 是 curses.h 来 强制 使 用 ncurses 函 数 
库 ， 同 时 需要 执行 如 下 的 编译 命令 : 

$ gcc -I/usr/include/ncurses program.c -o program -Incurses 


其 中 ，-I 选 项 用 于 指定 搜索 头 文件 的 目录 。 


在 可 下 载 的 源 代码 中 包含 的 Makefile 文 件 默认 会 假设 你 的 配置 
使 用 的 是 curses， 如 果 你 的 系统 不 是 这 种 情况 ， 你 必须 修改 该 文件 
或 手工 编译 本 章 的 程序 。 


如 果 不 能 确认 你 的 系统 中 的 curses 究 竟 是 如 何 配置 的 ， 你 可 以 参考 
ncurses 的 手册 页 或 查看 其 他 在 线 文档， 和 见 的 在 线 文 档 目录 位 
于 /usrshare/doc/ 之 下 。 在 该 目录 中 ， 你 会 发 现 curses 或 ncurses 子 目录 ， 
通常 在 该 名 称 后 面 还 会 附加 版 本 号 。 


6.2 curses is ALAS 


curses 例 程 工作 在 屏幕 、 窗 口 和 子 窗 口 之 上 。 所 谓 屏 幕 束 是 你 正在 
写 的 设备 〈 通 各 是 终端 屏幕 ， 也 可 能 是 xterm 屏 幕 ) 。 屏 幕 占 据 了 设备 
上 全 部 的 可 用 显示 面积 ， 当 然 ， 如 果 设 备 是 X 视 窗 中 的 一 个 终端 窗口 ， 
则 屏幕 就 是 该 终端 窗口 内 所 有 可 用 的 字符 位 置 。 无 论 何 时 ， 至 少 存在 一 
个 curses 窗 口 ， 我 们 称 之 为 stdscr， 它 与 物理 屏幕 的 尺寸 完全 一 样 。 你 可 
以 创建 一 些 尺 寸 小 于 该 屏幕 的 窗口 ， 窗 口 可 以 互相 重 登 ， 它 们 还 可 以 拥 
有 自己 的 多 个 子 窗口 ， 但 每 个 子 窗口 必须 总 是 被 包含 在 它 的 父 窗口 内 。 

curses 函 数 库 用 两 个 数据 结构 来 映射 终端 屏幕 ， 它 们 是 stdscr 和 
curscr。 两 者 中 ，stdscr 更 重要 一 些 ， 它 会 在 curses 函 数 产 生 输 出 时 被 刷 
新 。stdscr 数 据 结构 对 应 的 是 “标准 屏幕 ”， 它 的 工作 方式 与 stdio 函 数 库 中 
的 标准 输出 stdout 非 常 相 似 。 它 是 curses 程 序 中 的 默认 输出 窗口 。curscr 
数据 结构 和 stdscr 相 似 ， 但 它 对 应 的 是 当前 屏幕 的 样子 。 在 程序 调用 
refresh 函 数 之 前 ， 输 出 到 stdscr 上 的 内 容 不 会 显示 在 屏幕 上 。curses 函 数 
库 会 在 refresh 函 数 被 调用 时 比较 stdscr 〈 屏 幕 将 会 是 什么 样子 ) 与 第 二 个 
数据 结构 curscr 〈 屏 幕 当 前 的 样子 ) 之 间 的 不 同 之 处 ， 然 后 用 这 两 个 数 
据 结 构 之 间 的 差异 来 刷新 屏幕 。 

有 的 curses 程 序 需 要 知道 curses 维 护 的 stdscr 结 构 ， 因 为 有 些 curses 函 
数 需要 以 该 结构 为 参数 。 但 真正 的 stdscr 结 构 是 与 具体 实现 相关 的 ， 它 
决 不 能 被 直接 访问 。curses 程 序 无 需 使 用 curscr 数 据 结 构 。 

综 上 所 述 ， 在 curses 程 序 中 输出 字符 的 过 程 如 下 所 示 。 

(1) 使 用 curses 函 数 刷 新 逻辑 屏幕 。 
(2) 要 求 curses 用 refresh 函 数 来 刷新 物理 屏幕 。 

除了 易于 编程 以 外 ， 分 成 两 个 步骤 来 完成 字符 输出 的 好 处 还 在 于 ， 
curses 屏 幕 的 刷新 效率 很 高 。 虽 然 这 点 对 控制 台 屏 幕 来 说 并 不 重要 ， 但 
如 果 你 是 通过 慢 速 网 络 连接 到 主机 上 来 运行 程序 ， 则 屏幕 刷新 效率 的 提 
高 意义 就 很 大 了 。 

一 个 curses 程 序 会 多 次 调用 逻辑 屏幕 输出 函数 ， 例 如 在 屏幕 上 移动 
光标 到 达 正 确 的 位 置 ， 然 后 输出 文本 、 绘 制 线 框 。 在 程序 执行 的 某 些 阶 
段 ， 用 户 需 要 看 到 全 部 的 输出 结果 。 这 时 curses 一 般 会 通过 调用 refresh 
函数 计算 出 让 物理 屏幕 和 逻辑 屏幕 相对 应 的 最 佳 途 径 。curses 通 过 使 用 
合适 的 终端 功能 标志 及 优化 光标 的 移动 来 刷新 屏幕 ， 与 立刻 执行 所 有 的 
屏幕 写 操作 相 比 ，curses 所 需要 输出 的 字符 要 少 得 多 。 

逻辑 屏幕 的 布局 通过 一 个 字符 数组 来 实现 ， 它 以 屏幕 的 左上 角 一 一 
坐标 《0,0〉 为 起 点 ， 通 过 行 号 和 列 号 来 组 织 ， 如 图 6-1 所 示 。 


所 有 的 curses 函 数 使 用 的 坐标 都 是 y 值 〈 行 号 ) 在 前 、X 值 〈 列 号 ) 
在 后 。 每 个 位 置 不 仅 包 含 该 屏幕 位 置 处 的 字符 ， 还 包含 它 的 属性 。 可 显 
示 的 属性 依赖 物理 终端 的 功能 标志 ， 但 一 般 至 少 会 支持 粗 体 和 下 划 线 这 
两 个 属性 。Linux 控 制 台 通常 还 支持 反 白 显 示 和 色彩 属性 ， 后 面 将 介绍 
这 方面 的 内 容 。 

由 于 curses 函 数 库 在 使 用 时 需要 创建 和 删除 一 些 临 时 的 数据 结构 ， 

所 以 所 有 的 curses 程 序 必 须 在 开始 使 用 curses 函 数 库 之 前 对 其 进行 初始 
化 ， 并 在 结束 使 用 后 允许 curses 恢 复原 先 设置 。 这 两 项 工作 是 由 initscr 和 
endwin 函 数 分 别 完成 的 。 


sc 验 一 个 “Hello World”curses 程 序 
在 本 例 中 ， 你 将 编写 一 个 非常 简单 的 curses 程 序 screenl.c， 来 显示 


这 些 及 其 他 一 些 基 本 函数 的 使 用 方法 。 然 后 我 们 再 介绍 它们 的 函数 原 
型 。 

(1) 在 程序 里 加 上 curses.h 头 文件 ， 在 main 函 数 中 增加 初始 化 和 重 
置 curses 库 的 函数 调用 : 


Sinclude <unistd 


nd 


endwin(); 
exit (EXIT_SUCCESS)} ; 


(2) FENCE AE BEEZ fal, St i oh BE 48 BRS EAB 
标 (5,15) 处 、 输 出 “Hello World”， 然 后 刷新 物理 屏幕 的 代码 。 最 后 ， 
调用 函数 sleep (2) 将 程序 暂停 两 秒 钟 ， 以 便 在 程序 结束 前 看 到 输出 的 
A 


结果 : 


运行 程序 时 ， 你 将 在 空白 屏幕 的 左上 部 分 看 到 “Hello ”World” 字 符 
串 ， 如 图 6-2 所 示 。 


rick@locathost:~/bip4e/chos6 
File Edit View Terminal Tabs Help 


Hello World 


实验 解析 
这 个 程序 初始 化 curses 函 数 库 ， 将 光标 移动 到 屏幕 上 的 某 个 位 置 ， 
然后 显示 一 些 文 本 。 稍 停 片刻 后 ， 它 关闭 curses 函 数 库 并 退出 。 


6.3 


正如 你 所 看 到 的 ， 所 有 的 curses 程 序 必 须 以 initscr 函 数 开 始 ， 以 
endwin 函 数 结束 。 下 面 是 它们 的 头 文件 定义 : 


#include <curses.h> 


WINDOW *initscr(void); 
int endwin (void); 


initscr 函 数 在 一 个 程序 中 只 能 调用 一 次 。 如 果 成 功 ， 它 返回 一 个 指 
和 
退出 ; 

endwin 函 数 在 成 功 时 返回 OK， 失 败 时 返回 ERR。 你 可 以 先 调用 
endwin 函 数 退 出 curses， 然 后 通过 调用 clearok (stdscr,1) refresh M ži 
继续 curses 操 作 。 这 实际 上 是 首先 让 curses 忘 记 物 理 屏幕 的 样子 ， 然 后 强 
迫 它 执行 一 次 完整 的 屏幕 原文 重 现 。 


6.3.1 输出 到 屏幕 
curses 函 数 库 提供 了 一 些 用 于 刷新 屏幕 的 基本 函数 ， 它 们 是 : 


#include <curses.h> 


int addch(const chtype char_to_add); 

int addchstr(chtype *const string_to_add); 

int printw(char *format, ...); 

int refresh(void); 

int box(WINDOW *win_ptr, chtype vertical char, chtype horizontal char); 
int insch(chtype char_to_insert); 


int insertln(void); 
int delch(void) ; 
int deleteln(void); 
int beep(void) ; 

int flash(void); 


curses 有 其 自己 的 字符 类 型 chtype， 它 可 能 比 标准 的 char 类 型 包含 更 
多 的 二 进 制 位 。 在 ncurses 的 标准 Linux 版 本 中 ，chtype 实 际 上 是 unsigned 
long 类 型 的 一 个 typedef 类 型 定义 。 

add 系 列 函数 在 光标 的 当前 位 置 添 加 指定 的 字符 或 字符 串 。Pprintw 本 
数 采 用 与 printf 函 数 相同 的 方法 对 字符 串 进行 格式 化 ， 然 后 将 其 添加 到 
光标 的 当前 位 置 。refresh 函 数 的 作用 是 刷新 物理 屏幕 ， 成 功 时 返回 


OK， 发 生 错 误 时 返回 ERR。box 函 数 用 来 围绕 一 个 窗口 绘制 方 框 。 


在 标准 curses 函 数 库 中 ， 竺 直 和 水 平 线 字 符 可 能 只 能 使 用 普通 
字符 。 但 在 扩展 curses 函 数 库 中 ， 你 可 以 利用 两 个 定义 
ACS_VLINE 和 ACS_HLINE 来 分 别提 供 垂直 和 水 平 线 字符 ， 它 们 
可 以 让 你 绘制 更 好 看 的 方 枉 ， 但 这 需要 终端 支持 这 些 画 线 字符 。 
一 般 来 说 ， 这 个 功能 在 xterm 窗 口中 比 在 标准 控制 台中 工作 得 更 
好 ,但 系统 对 该 功能 的 支持 往往 是 不 完整 的 ， 所 以 如 果 需 要 考虑 
程序 的 可 移植 性 ， 我 们 建议 最 好 不 要 在 程序 中 使 用 它们 。 


insch 函 数 插入 一 个 字符 ， 将 已 有 字符 同 右 移 ， 但 此 操作 对 行 尾 的 影 
啊 并 未 定义 ， 县 体 情 况 取 决 于 你 所 使 用 的 终端 。insertn 函 数 的 作用 是 插 
入 一 个 空白 行 ， 将 现 有 行 依次 癌 下 移 一 行 。 两 个 delete 函 数 的 作用 与 上 
述 两 个 insert 函 数 正 好 相反 。 

如 果 要 让 程序 发 出 声音 ， 你 可 以 调用 beep 函 数 。 但 因为 有 极 少 部 分 
终端 不 能 发 出 声音 ， 所 以 有 些 curses 设 置 会 在 调用 beep 函 数 时 让 屏幕 闪 
烁 。 如 果 你 在 一 个 比较 繁忙 的 办 公 室 上 班 ， 蜂 鸣 就 可 能 产生 于 各 种 机 器 
设备 ， 这 时 ， 你 可 能 更 愿意 选择 屏幕 内 烁 这 种 方式 。 正 如 你 预期 的 那 
样 ，flash 函 数 的 作用 就 是 使 屏幕 闪烁 ， 但 如 果 无 法 产生 闪烁 效果 ， 它 将 
尝试 在 终端 上 发 出 声音 。 

6.3.2 ”从 屏幕 读 取 

你 可 以 从 屏幕 上 读 取 字 符 ， 虽 然 这 个 功能 并 不 党 用， 因为 一 般 来 
说 ， 要 想 了 解 屏幕 上 所 写 内 容 很 容易 。 但 如 果 需 要 该 功能 ， 可 用 下 面 这 
HEE PKB SE EME : 


#include <curses.h> 


chtype inch(void); 
int instr(char *string); 
int innstr (char *string, int number_of_characters); 


inch 函 数 总 是 可 用 的 ， 但 instr 和 innstr 函 数 并 不 总 被 文 持 。inch 函 数 
返回 光标 当前 位 置 的 字符 及 其 属性 信息 。 注 意 ，inch 函 数 返回 的 并 不 是 
一 个 字符 ， 而 是 一 个 chtype 类 型 的 变量 ， 而 instr 和 innstr 函 数 则 将 返回 内 
容 写 到 字符 数组 中 。 


6.3.3 JE BR BEF 


TARR BR EMA KER ATA, “Ee: 


#include <curses.h> 


int erase(void); 
int clear (void); 
int clrtobot (void); 
int clrtoeol (void); 


erase 国 数 在 每 个 屏幕 位 置 号 上 衬 白 字符 。clear 函 数 的 功能 类 似 erase 
函数 ， 它 也 是 用 于 清 屏 ， 但 它 还 通过 在 内 部 调用 一 个 底层 函数 clearok 来 
强制 重 现 屏 幕 原 文 。clearok 函 数 会 强制 执行 清 屏 操作 ， 并 在 下 次 调用 
refresh 函 数 时 重 现 屏幕 原文 。 

clear 函 数 通 各 是 使 用 一 个 终端 命令 来 清除 整个 屏幕 ， 而 不 是 党 试 删 
除 当 前 屏幕 上 每 个 非 空 白 的 位 置 。 因 此 ，clear 函 数 是 一 种 可 以 彻底 消除 
屏幕 的 可 靠 方 法 。 当 屏幕 显示 变 得 混乱 时 ，clear 函 数 和 refresh 函 数 的 结 
合 提 供 了 一 各 有效 的 重新 绘制 屏幕 的 手段 。 

clrtobot 函 数 清 除 当 前 光标 位 置 直到 屏幕 结尾 的 所 有 内 容 。clrtoeol 函 
数 清除 当前 光标 位 置 直 到 光标 所 处 行 行 尾 的 所 有 内 容 。 


6.3.4 ”移动 光标 


用 于 移动 光标 的 函数 只 有 1 个 ， 另 有 1 个 函数 用 来 控制 在 刷新 屏幕 后 
curses 将 光标 放置 的 位 置 : 


#include <curses.h> 


int move(int new_y, int new_x); 
int leaveok(WINDOW *window_ptr, bool leave_flag); 


move PÁ ži H SR I Gh A GS EH. WIE, «BR REA IN 
以 左上 角 (0,0) 为 起 点 。 在 大 多 数 curses 版 本 中 ， 有 两 个 包含 物理 屏幕 
尺寸 大 小 的 外 部 整数 LINES 和 COLUMNS， 它 们 可 用 于 决定 参数 new_y 
和 new_Xx 的 最 大 可 取 值 。 调 用 move 函 数 本 身 并 不 会 使 物理 光标 移动 ， 它 
仅 改 变 逻 辑 屏幕 上 的 光标 位 置 ， 下 次 的 输出 内 容 就 将 出 现在 该 位 置 上 。 
如 果 和 希望 物理 屏幕 上 的 光标 位 置 在 调用 move 函 数 之 后 立刻 有 变化 ， 束 
需 在 它 之 后 立刻 调用 refresh 函 数 。 

leaveok 函 数 设 置 了 一 个 标志 ， 该 标志 用 于 控制 在 屏幕 刷新 后 curses 
将 物理 光标 放置 的 位 置 。 默 认 情 况 下 ， 该 标志 为 false， 这 意味 着 屏幕 刷 
新 后 ， 便 件 光 标 将 停留 在 屏幕 上 逻辑 光标 所 处 的 位 置 。 如 果 访 标志 被 设 
置 为 tue， 则 硬件 光标 会 被 随机 地 放置 在 屏幕 上 的 任意 位 置 。 一 般 来 


说 ， 默 认 选 项 更 符合 用 户 的 需求 ， 这 能 确保 光标 停留 在 一 个 有 意义 的 位 
置 。 


6.3.5 字符 属性 


每 个 curses 字 符 部 可 以 有 一 些 属性 用 于 控制 该 字符 在 屏幕 上 的 显示 
方式 ， 前 提 是 用 于 显示 的 硬件 设备 能 够 支持 要 求 的 属性 。 预 定义 的 属性 
有 A_BLINK、A BOLD、A _DIM、A_REVERSE、A_STANDOUT 和 和 
AL a 你 可 以 用 下 面 这 些 函 数 来 设置 单个 属性 或 同时 设置 多 
| TE: 


#include <curses.h> 


int attron(chtype attribute); 
int attroff(chtype attribute); 
int attrset(chtype attribute) ; 
int standout (void); 
int standend(void) ; 


attrset 函 数 设置 curses 属 性 ，attron 和 attroff 函 数 在 不 影响 其 他 属性 的 
前 提 下 局 用 或 关闭 指定 的 属性 。standout 和 standend 函 数 提 供 了 一 种 更 加 
通用 的 强调 或 “突出 * 模 式 ， 在 大 多 数 终 端 上 ， 它 通 节 被 映射 为 肥 白 显 
示 。 


X 验 移动 、 插 入 和 属性 

现在 ， 你 已 掌握 了 许多 管理 屏幕 的 方法 ， 下 面 可 以 尝试 编写 一 个 更 
复杂 的 例子 moveadd.c 了 。 你 将 在 程序 中 包含 多 个 对 refresh 和 sleep 函 数 的 
调用 ， 以 便 了 解 在 程序 执行 的 每 个 阶段 屏幕 的 显示 情况 。 一 般 情况 下 ， 
curses 程 序 会 尽 可 能 少 地 刷新 屏幕 ， 因 为 这 并 不 是 一 种 很 有 效 的 操作 。 
这 里 的 代码 主要 是 方便 演示 。 

(1) 在 程序 的 开始 包含 一 些 必要 的 头 文件 ， 定 义 几 个 字符 数组 和 
一 个 指向 这 些 数组 的 指针 ， 然 后 对 curses 结 构 进 行 初始 化 : 


include <stdio.h> 
#include <unistd.h> 
tinclude <stdlib.h> 
*include <string.h> 
include <curses.h> 


int main{) 

{ 
const char witch_one[] = * First Witch “7 
const char witch _two[] = * Second Witch *; 
const char *scan_ptr; 


initser(); 


(2) 现在 是 最 初 要 显示 的 3 组 文本 ， 它 们 会 以 1 秒 为 间隔 依次 显示 
在 屏幕 上 。 请 注意 对 文本 属性 标志 的 开关 : 


move(5, 15); 
attron(A_BOLD) ; 
printw(*ts*, *Macbeth"); 
attroff (A_BOLD) ; 
refresh(); 


Sleep(1); 


move(8, 15); 

attron(A_STANDOUT) ; 

printw("%ts*, “Thunder and Lightning’); 
attroff (A_STANDOUT} ; 

refresh(); 

sleep(l); 


move(10, 10); 

printw("ts*, "When shall we three meet again"); 
move(il, 23); 

printw("%s", “In thunder, lightning, or in rain ?"); 
move(13, 10); 

printw("%s*, "When the hurlyburly’s done,"); 

move (14,23); 

printw(*ts*, "When the battle's lost and won.*); 
refresh(); 

sleep(i); 


(3) 确定 演员 并 将 他 们 的 名 字 以 一 次 一 个 字符 的 方式 插入 到 指定 
的 位 置 : 
attron(A_DIM); 
scan_ptr = witch_one + strlen(witch_one) - 1; 
while(scan_ptr != witch_one) { 


move (10,10); 
insch(*scan_ptr--); 


} 
scan_ptr = witch_two + strlen(witch_two) - 1; 
while (scan_ptr != witch_two) { 


move(13, 10); 
insch(*scan_ptr--); 
} 
attroff(A_DIM) ; 
refresh(); 
sleep(1); 


(4) 最 后 ， 将 光标 移动 到 屏幕 的 右 下 角 ， 然 后 结束 程序 : 
move (LINES - 1, COLS - 1); 


refresh(); 
sleep (1); 


endwin() ; 
exit (EXIT_SUCCESS) ; 


当 运 行 这 个 程序 时 ， 最 终 的 屏幕 如 图 6-3 所 示 。 

EEA Ae» TC FRAY eee aE HC Hae OL pee ER, E 
也 未 能 显示 出 区 标的 位 置 ， 光标 的 位 置 应 该 在 屏幕 的 右 下 和 角 。 

你 可 能 会 发 现 ， 与 标准 控制 台 相 比 ，xterm 能 更 加 准确 、 可 靠 地 显 
示 curses 程 序 的 输出 效果 。 


rick@localhost:-/bipse/cho6 
file Edt Wew Terminal Tabs Help 


Macbeth 


First witch when shall we three seet again 
In thunder, Lightning, or im rain 


Sccond Witch When the hurlyburly's donc, 
when the battle's lost and won. 


图 6-3 


实验 解析 

在 初始 化 一 些 变量 和 curses 屏 幕 之 后 ， 使 用 move 函 数 在 屏幕 上 移动 
光标 。 通 过 attron 和 attroff 函 数 来 控制 显示 在 屏幕 上 指定 位 置 的 文本 的 属 
性 。 然 后 ， 程 序 使 用 insch 函 数 来 演示 如 何 插入 字符 。 最 后 ， 程 序 关 闭 
curses K XUE FE Zi HR o 


6.4 TEN 


curses 函 数 库 不 仅 提 供 了 控制 屏 医 显示 的 易 用 接口 ， 还 提供 了 控制 
键盘 的 简单 方法 。 


6.4.1 键盘 模式 
键盘 读 取 例 程 由 键盘 模式 控制 。 用 于 设置 键盘 模式 的 函数 有 : 


#include <curses.h> 


int echo(void); 

int noecho (void); 
int cbreak (void); 
int nocbreak (void); 
int raw(void); 

int noraw (void); 


两 个 echo 函 数 用 于 开局 或 关闭 输入 字符 的 回 显 功能 。 其 余 4 个 函数 
调用 用 于 控制 在 终端 上 输入 的 字符 传送 给 curses 程 序 的 方式 。 

为 解释 清楚 cbreak 函 数 的 作用 ， 你 需要 首先 理解 何 为 默认 输入 模 
式 。 当 curses 程 序 通 过 调用 initscr 函 数 开 始 运行 时 ， 输 入 模式 被 设置 为 预 
处 理 模 式 〈 或 称 为 cooked 横 式 ) 。 这 意味 着 所 有 处 理 都 是 基于 行 的 ， 也 
了 驶 是 说 ， 只 有 在 用 户 按 下 回 车 键 之 后 ， 输 入 的 数据 才 会 被 传送 给 程序 。 
在 这 种 模式 下 ， 键 盘 特 殊 字 符 被 启用 ， 所 以 按 下 合适 的 组 合 键 即 可 在 程 
序 中 产生 一 个 信号 ， 如 果 是 通过 串 行 口 或 调制 解 调 器 等 连接 终端 ， 则 流 
控 也 处 于 启用 状态 。 程 序 可 通过 调用 cbreak 函 数 将 输入 模式 设置 为 
cbreak 模 式 ， 在 这 种 模式 下 ， 字 符 一 经 键入 就 被 立刻 传递 给 程序 ， 而 不 
像 在 cooked 模 式 中 那样 首先 缓存 字符 ， 直 到 用 户 按 下 回 车 键 后 才 将 用 户 
输入 的 字符 传递 给 程序 。cbreak 模 式 与 cooked 模 式 一 样 ， 键 盘 特 殊 字 符 
也 被 司 用 ， 但 一 些 简 单 的 特殊 字符 ， 如 退 格 键 Backspace 会 被 直接 传递 
给 程序 处 理 ， 所 以 如 果 想 让 退 格 键 保留 原来 的 功能 ， 你 就 必须 目 己 在 程 
序 中 实现 它 。 

raw 函 数 调 用 的 作用 是 关闭 特殊 字符 的 处 理 ， 所 以 执行 该 函数 调用 
后 ， 再 想 通 过 输入 特殊 字符 序列 来 产生 信号 或 进行 流 控 就 不 可 能 了 。 
nocbreak 函 数 调用 将 输入 模式 重新 设置 为 cooked 模 式 ， 但 特殊 字符 的 处 
理 方式 保持 不 变 。noraw 函 数 调 用 同时 恢复 cooked 模 式 和 特殊 字符 处 理 


6.4.2 at HA 
读 取 键盘 输入 非 闻 简单 ， 主 要 的 函数 有 : 


#include <curses.h> 


int getch(void) ; 

int getstr(char *string); 

int getnstr (char *string, int number of characters); 
int scanw(char *format, ...); 


这 些 函数 的 行为 与 它们 的 非 curses 版 本 getchar、gets 和 scanf 非 常 相 
似 。 要 注意 的 是 ，getstr 函 数 对 其 返回 的 字符 串 的 长 度 没 有 限制 ， 所 以 
使 用 这 个 函数 时 要 非常 小 心 。 如 果 所 使 用 的 curses 版 本 支持 getnstr 函 数 
( 它 可 以 对 读 取 的 字符 数目 加 以 限制 》， 你 就 应 该 尽 可 能 地 用 它 来 蔡 代 
getstr 国 数 。 这 与 你 在 第 3 章 中 看 到 的 gets 和 fgets 函 数 非常 类 似 。 

下 面 是 一 个 短小 的 示例 程序 ipmode.c， 它 演示 了 如 何 处 理 键盘 。 


X 验 键盘 模式 和 输入 
G) 首先 ， 设 置 程序 并 执行 初始 化 curses 函 数 库 的 调用 : 


lude <uni } 

nclude <stdlib.h> 
mclude <curses.h> 
nclude <string.h> 


_ 和 
ao Dh po pe i 
> 2 - : : 


efresh(); 


(2) 用 户 输 入 密码 时 ， 你 不 能 让 密码 回 显 在 屏幕 上 。 然 后 ， 检 查 
用 户 输 入 的 密码 是 否 等 于 xyzzy: 


(3) 最后， 重新 局 用 键盘 回 旺 ， 并 给 出 密码 验证 成 功 或 失败 的 信 


实验 解析 

关闭 键盘 输入 回 显 并 将 输入 模式 设置 为 cbreak 后 ， 你 设置 一 块 内 存 
区 域 用 于 接收 用 户 输 入 的 密码 。 每 个 输入 的 密码 字符 被 并 即 处 理 并 在 屏 
幕 的 下 一 个 位 置 上 显示 一 个 * 号 。 你 需要 在 每 次 输出 * 号 后 刷新 屏幕 ， 然 
后 ， 用 stmcmp 函 数 来 比较 用 户 输入 的 密码 和 保存 在 程序 中 的 正确 密 


如 果 使 用 的 curses 函 数 库 版 本 很 老 ， 你 可 能 需要 在 getstr 函 数 调 
用 之 前 加 上 一 个 refresh 函 数 调 用 。 在 ncurses 版 本 中 ，getstr 函 数 调 用 
会 目 动 刷新 屏 秦 。 


到 目前 为 止 ， 你 一 直 将 终端 用 作为 一 个 全 屏幕 的 输出 介质 。 对 短 
小 、 简 单 的 程序 来 说 ， 这 样 做 一 般 已 足够 了 ， 但 curses 函 数 库 的 功能 远 
不 止 如 此 。 你 可 以 用 curses 函 数 库 在 物理 屏幕 上 同时 显示 多 个 不 同 尺 寸 
的 窗口 。 本 节 中 介绍 的 许多 函数 只 被 X/Open 规范 定义 的 扩展 curses 函 数 
库 支 持 ， 但 因为 ncurses 函 数 库 也 支持 它们 ， 所 以 在 大 多 数 平台 中 使 用 它 
们 并 不 会 出 现 问 题 。 现 在 是 时 候 开 始 学 习 多 窗口 的 使 用 方法 了 人。 你 还 将 
看 到 如 何 将 所 使 用 的 这 些 函 数 通 用 化 ， 并 应 用 到 多 窗口 的 情况 下 。 


6.5.1 WINDOW 结 构 


虽然 前 面 己 介绍 过 标准 屏幕 stdscr， 但 目前 为 止 ， 你 几乎 没有 使 用 
它 的 必要 。 因 为 ， 几 乎 所 有 我 们 前 面 讨论 过 的 函数 都 假设 它们 工作 在 
stdscr 之 上 ， 因 此 ，stdscr 无 需 作 为 一 个 参数 传递 给 这 些 函 数 。 

标准 屏幕 stdscr 只 是 WINDOW 结 构 的 一 个 特例 ， 就 像 标 准 输出 stdout 
是 文件 流 的 一 个 特例 一 样 。 WINDOW 2#i TAE H XE CESK MCF curses.h 
中 ， 虽 然 研 究 该 结构 是 有 意义 的 ， 但 程序 应 该 永远 都 不 要 直接 访问 它 ， 
因为 该 结构 在 不 同 的 curses 版 本 中 的 实现 方式 不 同 。 

你 可 以 用 函数 调用 newwin 和 delwin 来 创建 和 销毁 窗口 : 


#include <curses.h> 


WINDOW *newwin(int num of lines, int num of cols, int start_y, int start_x); 
int delwin(WINDOW *window to delete); 


newwin 函 数 的 作用 是 创建 一 个 新 窗口 ， 该 窗口 从 屏幕 位 置 〈start_y， 
start x) 开始 ， 行 数 和 列 数 分 别 由 参数 num_of lines 和 num_ of cols 指 
定 。 它 返回 一 个 指 同 新 窗口 的 指针 ， 如 果 新 窗口 创建 失败 则 返回 null。 
如 果 想 让 新 窗口 的 右 下 角 正 好 落 在 屏幕 的 在 下 角 上 ， 你 可 以 将 该 函数 的 
行 、 列 参数 设 为 0。 所 有 的 窗口 范围 都 必须 在 当前 屏幕 范围 之 内 ， 如 果 
新 窗口 的 任何 部 分 落 在 当前 屏幕 范围 之 外 ， 则 newwin 函 数 调用 将 失败 。 
通过 newwin 函 数 创 建 的 新 窗口 完全 独立 于 所 有 已 存在 的 窗口 。 默 认 情 况 
下 ， 它 被 放置 在 任何 已 有 窗口 之 上 ， 履 盖 〈 但 不 是 改变 ) 它们 的 内 容 。 
delwin 函 数 的 作用 是 删除 一 个 先前 通过 newwin 函 数 创建 的 窗口 。 
为 调用 newwin 函 数 可 能 会 给 新 窗口 分 配 内 存 ， 所 以 当 不 再 需要 这 些 窗 口 
时 ， 不 要 忘记 通过 delwin 函 数 将 其 删除 。 


注意 ， 和 于 万 不 要 尝试 删除 curses 自 己 的 窗口 stdscr 和 curscr! 


创建 新 窗口 后 ， 怎 样 才 能 对 它们 进行 写 操 作 呢 ? 答案 是 ， 几 乎 所 有 
你 已 见 过 的 函数 部 有 对 应 特定 窗口 进行 操作 的 通用 版 本 ， 并 且 为 方便 用 
户 的 使 用 ， 它 们 还 都 具备 光标 移动 的 功能 。 


6.5.2 ”通用 函数 


你 已 使 用 过 函数 addch 和 printw 在 屏幕 上 增加 字符 。 这 两 个 函数 ， 包 
括 其 他 一 些 函 数 ， 都 可 以 通过 加 上 一 些 前 级 变 为 通用 函数 。 前 级 w 用 于 
窗口 、mv 用 于 光标 移动 、mvw 用 于 在 窗口 中 移动 光标 。 如 果 查 看 大 多 
数 curses 函 数 库 实 现 中 的 curses 头 文件 ， 你 会 发 现 你 所 使 用 过 的 许多 函数 
都 只 是 调用 这 些 通 用 函数 的 简单 的 宏 定 义 definet) 。 

如 果 给 函数 增加 了 w 前 缀 ， 驶 必须 在 该 函数 的 参数 表 的 最 前 面 增加 
一 个 WINDOW 指 针 参 数 。 如 果 给 函数 增加 的 是 mv 前 级 ， 则 需要 在 函数 
的 参数 表 的 最 前 面 增加 两 个 参数 ， 分 别 是 纵 坐 标 y 和 横 坐 标 x， 这 两 个 坐 
标 值 指定 了 执行 操作 的 位 置 。 坐 标 值 y 和 x 是 相对 于 窗口 而 不 是 相对 于 屏 
幕 的 ， 坐 标 〈0,0) 代表 窗口 的 左上 和 角 。 

如 果 给 函数 增加 了 mvw 前 级 ， 束 需要 多 传递 3 个 参数 ， 它 们 分 别 是 
一 个 WINDOW 指 针 、y 和 x 坐标 值 。 让 人 困惑 的 是 ，WINDOWS 指 针 参 
数 总 是 出 现在 屏幕 坐标 值 之 前 ， 虽 然 从 前 绥 的 写法 来 看 ，y 和 x 人 参数 应 是 
首先 出 现 的 。 

作为 一 个 例子 ， 下 面 列 出 了 函数 addch 和 printw 的 所 有 原型 定义 集 : 


#include <curses.h> 


int addch(const chtype char); 

int waddch(WINDOW *window_pointer, const chtype char) 

int mvaddch(int y, int x, const chtype char); 

int mvwaddch(WINDOW *window_ pointer, int y, int x, const chtype char); 


int printw(char *format, ...); 

int wprintw(WINDOW *window_pointer, char TEOMAN eve)? 

int mvprintw(int y, int x, char *format, ...); 

int mvwprintw(WINDOW *window_pointer, int y, int x, char *format, ...); 


其 他 许多 函数 ， 例 如 ipch， 也 有 加 上 诸如 mv 和 w 前 绥 的 通用 函数 。 


#include <curses.h> 


int mvwin(WINDOW *window to move, int new_y, int new_x); 
int wrefresh(WINDOW *window_ptr); 

int wclear(WINDOW *window_ptr); 

int werase(WINDOW *window_ptr); 

int touchwin(WINDOW *window_ptr); 

int scrollok(WINDOW *window_ptr, bool scroll_flag); 

int scroll(WINDOW *window_ptr); 


mvwin 函 数 的 作用 是 在 屏幕 上 移动 一 个 窗口 。 因 为 不 允许 窗口 的 任 
何 部 分 超出 屏幕 范围 ， 所 以 如 果 在 调用 mvwin 范 数 时 将 窗口 的 某 个 部 
分 移动 到 屏幕 区 域 之 外 ，mvwin 函 数 调 用 将 会 失败 。 

wrefresh, wclear#llwerases K 24) 4ll Æ AY JY 24 refresh. clear#ll 
erases 国 数 的 通用 版 本 。 它 们 只 是 多 T -RWINDOWHEET BGK. 从 而 可 
针对 特定 的 窗口 进行 操作 ， 而 不 仅仅 局 限于 stdscr。 

touchwin 函 数 非常 特殊 ， 它 的 作用 是 通知 curses 函 数 库 其 指针 参数 
指 同 的 窗口 内 容 已 发 生 改 变 。 这 束 意 味 着 ， 在 下 次 调用 wrefresh 函 数 
时 ，curses 必 须 重 新 绘制 该 窗口 ， 即使 用 户 实 际 上 并 未 修改 该 窗口 中 的 
内 容 。 当 屏幕 上 重 登 着 多 个 窗口 时 ， 你 可 以 通过 该 函数 来 安排 要 显示 的 
窗口 。 

两 个 scroll 函 数控 制 窗口 的 卷 屏 。 如 果 传 递 给 scrollok 疯 数 的 是 布尔 
repo (通常 是 非 零 值 〉， 则 允许 窗 口 卷 屏 。 而 默认 情况 下 ， 窗 口 是 不 

$ 屏 的 。scroll 函 数 的 作用 只 是 把 窗口 内 容 上 卷 一 行 。 一 些 curses 孙 数 
库 的 实现 版 本 中 还 有 函数 wsct1， 它 有 一 个 指定 卷 行 行 数 的 参数 ， 而 且 
该 参数 还 可 以 指定 为 负 值 。 我 们 将 在 本 章 的 稍 后 部 分 再 次 讨论 卷 屏 问 


题 。 


实 验 管理 多 窗口 
现在 ， 你 已 知道 如 何 管 理 多 个 窗口 了 ， 接 下 来 ， 你 可 以 把 刚 学 到 的 
这 些 新 函数 应 用 在 程序 multiwl.c 中 。 为 简洁 起 见 ， 在 程序 中 忽略 了 错误 


检查 。 
D 与 往 第 一 样 ， 我 们 先 安排 好 各 种 定义 : 


m a 然后 ， 用 字符 填充 基本 窗口 ， 填 充 完 逻辑 屏幕 后 就 开始 刷新 
HE pEi 


(3) 现在， 创建 一 个 尺寸 为 10x20 的 新 窗口 ， 为 它 添加 一 些 文本 ， 
人 会 制 到 屏幕 上 : 


(4) 接 下 来 ， 对 背景 窗口 中 的 内 容 做 些 修改 。 当 再 次 刷新 屏幕 
时 ，new_window_ptr 指 回 的 窗口 将 被 遮盖 住 : 


(5) 此 时 ， 如 果 调 用 wrefresh 来 刷新 新 窗口 ， 则 什么 也 不 会 友 生 ， 
因为 你 并 未 对 新 窗口 做 过 改动 ; 


(6) 但 如 果 先 对 新 窗口 调用 一 次 touchwin 函 数 ， 让 curses 误 以 为 新 
窗口 中 的 内 容 已 发 生变 化 ， 则 下 一 个 wrefresh 函 数 调用 将 再 次 把 新 窗口 
调 到 屏幕 的 最 前 面 : 


(7) 接 下 来 ， 再 增加 另 一 个 加 框 的 重 登 窗 


们 : 


C8) 然后 ， 在 清 屏 和 删除 这 两 个 新 窗口 之 前 


popup_window_ptr = newwin(10, 20, 8, 8); 
box({popup_window_ptr, ‘|', ‘-'); 
mvwprintwipopup_window_ptr, 5, 2, °ts*, “Pop Up Window!"); 
wrefresh(popup_window_ptr); 

sleep(2); 


touchwin (new_window_ptr) ; 
wrefresh (new_window ptr): 


welear (new_window_ptr) ; 
wrefresh (new_window_ptr); 


delwin(new_window_ptr); 
touchwin (popup_window_ptr); 
wrefresh(popup_window_ptr); 
delwin(popup_window_ptr) ; 


touchwin(stdscr) ; 
refresh(); 


exit (EXIT_SUCCESS) ; 


遗憾 的 是 ， 我 们 无 法 让 读者 在 书 中 看 到 这 一 切 发 生 的 过 程 。 图 6-4 


显示 了 绘制 第 一 个 弹出 窗口 后 的 屏幕 截图 。 


rickiplocathost:~/bipse/chos 
file Edit View Terminal Tabs Help 


0123456789012345678901234567890123456789012345678901234567890123456789 


123456789012345678901234567890123456 7890 123456780012345678901234567890 
234567890 123456789012341567890 1234567890 123456 7890123456789012345678981 
345678901234567890 1234567890 1234567890123456 7890123456 7890123456789012 
456789012345678901 234567890 1234567890 1 23456 7890122456 7896 1234567890123 
56789 012345678901234567890123456789012345678901234 
67896 123456789012345678991234567890123456789012345 
78901 Hello World 234567890123456 7890 1234567899 1234567890123456 
89612 345678901 23456 7890 1234567896 123456 72981234567 
96123 4567896123456 7890 1234567896 1234567896812345673 
01234 Notice how very 105678901234567896123456 7890123456 7890122456789 
12345ng Lines wrap 1nside6/898123456/89012 3450 /898123456/89012 4455/3898 
23456 the window 7396124456 1898124456 789812 345678981 23455/8981 
34567 896 174456 /698 17 4456789817 3456789817 3455789917 
4560/8 9617 3456 (898174456 789812 2456/8980 17 44557/898173 
S6/78Y8 17 4456/8961 7 4456 (89617 1456 / 898) 2 345678981 7 1450789817 1450/8981 2 34 
67896 1734567896 1 2 34567898 1 734567898 | 7 34567890 | 2 345678981 7 2456789817 345 
7898 173496 78981774567 898 1 2 345678908 1 2 34567898 17 34567898 1 29496789017 3456 
6961234567890 12354567890 12345678901234567890123456769012345678961234567 
901234567890 1234567690 1234567890 1234567898 1234507690123456789612345678 


61234567896 123456789012345678901234567690123456 7896 1234567890 123450789 


显示 如 图 6-5。 


实验 解析 
在 通常 的 初始 化 过 程 之 后 ， 程 序 使 用 字母 填充 标准 屏幕 ， 以 便 用 户 


È 
M 


看 到 添加 在 其 上 的 新 curses 窗 口 。 然 后 ， 程 序 演示 了 如 何在 背景 


在 改变 背景 窗口 后 ， 在 屏幕 上 又 绘制 了 一 个 弹出 窗口 ， 这 时 屏幕 的 


ZEW 


加 一 个 新 窗口 ， 以 及 新 窗口 中 文本 的 折 行 效果 。 你 还 看 到 了 如 何 使 用 
touchwin 来 强制 curses 重 新 绘制 窗口 ， 即 使 窗口 内 容 未 发 生 任何 改变 。 


rickGlocathost:~/bipge/cho6 


File Edit View Terminal Tabs Help 

91234567890 1234567890 1234567890123456789012345678901234567890123456789 F] 

12345678901234567890123456789012345678901234567890123456789012345678990 

234567890 12345678901234567890 1234567890 1234567890123456789012345678901 

345678901234567890123456789012345678901234567890 1234567890 123456789012 

45678901234567890 1234567890 1234567890123456 7890123456 78901234567896123 

612345678901234567890123456789612345678901234 

1234567890 12345678901234567890123456789012345 

Hello World 234567890123456789012345678901234567890123456 

Fe 1578961234567899123455789912345678961234567 

|789012345678901234567890123456789012345678 

NI | 8961234567896 12345678901234567896 123456789 

12345ng | [90123450 /898 123456 890123456 7898123456 /898 

23450 th {8123456 7898123456 7898123456 7898122456 /898) 

| Pop Up Window!) | 127349678981734560 7890123450 /898174450 789817 

| 72496 789817 3456 189817 3456 78981 734567890173 

| 4456/7898 173456789012 3456 /H98 173450 (4981734 

4578981 2345678901 7345678981 734656789812345 

5678901 234567890 12 345678981 2 345678901 73456 

6961234567890 1234567890] 2345678961234567898 1 234567890 1234567896 1234567 

981234567890 1234567896 12345678901234567690 1234567890123456789012345678 

012345678901234567890 1234567896 1234567890 12345678901234567690123456789 


接着 ， 程 序 添 加 了 第 二 个 窗口 ， 该 窗口 覆盖 了 第 一 个 窗口 的 内 容 ， 
这 演示 了 curses 是 如 何 管理 重 登 窗口 的 。 最 后 ， 程 序 关 闭 curses 函 数 库 并 
退出 。 

从 上 面 的 示例 代码 中 可 以 看 出 ， 为 了 让 窗口 在 屏幕 上 以 正确 的 顺序 
显示 ， 你 必须 在 刷新 窗口 时 非常 小 心 。 因 为 curses 函 数 库 并 不 存储 关于 
窗口 之 间 层 次 关系 的 任何 信息 ， 所 以 如 果 要 求 curses 刷 新 多 个 窗口 ， 你 
必须 自己 管理 窗口 之 间 的 层次 关系 。 


为 确保 curses 能 够 以 正确 的 顺序 绘制 窗口 ， 你 必须 以 正确 的 顺 
序 对 它们 进行 刷新 。 其 中 一 个 办 法 就 是 ， 将 所 有 窗口 的 指针 存储 
到 一 个 数组 或 列表 中 ， 你 通过 这 个 数组 或 列表 来 维护 它们 应 该 显 
示 在 屏幕 上 的 顺序 。 


6.5.4 TL ex hall 3 


从 上 一 市 的 例子 中 可 以 看 出 ， 对 多 个 窗口 进行 刷新 需要 一 定 的 技 
巧 ， 但 还 不 至 于 太 麻 燃 。 但 当 要 更 新 的 终 剖 是 通过 慢 速 链 路 连接 到 主机 


时 ， 这 个 潜在 的 问题 束 会 变 得 非常 严重 。 坟 运 的 是 ， 现 在 这 种 情况 已 经 
很 少见 了 ， 但 实际 上 处 理 这 个 问题 非常 简单 ， 所 以 ， 为 了 内 容 的 完整 
性 ， 我 们 在 这 里 介绍 这 个 问题 的 解决 方法 。 

我 们 的 目标 是 尽量 减少 需要 在 屏幕 上 绘制 的 字符 数目 ， 因 为 在 慢 速 
链 路 上 ， 屏 幕 绘 制 的 速度 可 能 会 慢 得 让 人 难以 忍受 。curses 函 数 库 为 此 
提供 了 一 种 特殊 手段 ， 这 需要 用 到 下 面 两 个 函数 : wnoutrefresh 和 
doupdate: 


#include <curses.h> 


int wnoutrefresh(WINDOW *window_ptr); 
int doupdate(void) ; 


wnoutrefresh 函 数 用 于 决定 把 哪些 字符 发 送 到 屏幕 上 ， 但 它 并 不 真 
正 地 发 送 这 些 字 符 ， 真 正 将 更 新 发 送 到 终端 的 工作 由 doupdate 函 数 来 完 
成 。 如 果 只 是 调用 wnoutrefresh 函 数 ， 然 后 立刻 调用 doupdate 函 数 ， 则 它 
的 效果 与 直接 调用 wrefresh 完 全 一 样 。 但 如 果 想 重新 绘制 多 个 窗口 ， 你 
可 以 为 每 个 窗口 分 别 调用 wnoutrefresh 消 数 〈( 当 然 要 按 正确 的 顺序 来 操 
YE) ， 然 后 只 需 在 调用 最 后 一 个 wnoutrefresh 之 后 调用 一 次 doupdate 函 数 
即 可 。 这 人 允许 curses 依 次 为 每 个 窗口 执行 屏幕 更 新 计算 工作 ， 最 后 仅 把 
最 终 的 更 新 结果 输出 到 屏幕 上 。 这 种 做 法 可 以 最 大 限度 地 减少 curses 需 
要 发 送 的 字符 数目 。 


介绍 完 多 窗口 后 ， 我 们 来 看 一 种 多 窗口 的 特例 : 子 窗口 。 子 窗口 的 
创建 和 删除 可 以 用 以 下 几 个 函数 来 完成 : 


WINDOW *subwin(WINDOW *parent, int num of lines, int num of cols, 
int start_y, int start_x); 
int delwin(WINDOW *window_to delete); 


subwin 函 数 的 参数 几乎 与 ewwin 函 数 完全 一 样 ， 子 窗口 的 删除 过 程 
也 和 其 他 窗口 一 样 ， 都 是 通过 调用 delwin 函 数 来 完成 。 如 同 对 竺 新 窗口 
一 样 ， 你 可 以 使 用 以 mvw 为 前 组 的 函数 来 写 子 窗口 。 事 实 上 ， 在 大 多 数 
情况 下 ， 子 窗口 的 行为 与 新 窗口 非常 相似 ， 两 者 之 间 只 有 一 个 重要 的 区 
Bl: 子 窗口 没有 自己 独立 的 屏幕 字符 存储 空间 ， 它 们 与 其 父 窗口 〈 在 创 
建 子 窗口 时 指定 ) 共享 同一 字符 存储 空间 。 这 意味 着 ， 对 子 窗口 中 内 容 
的 任何 修改 都 会 反映 到 其 父 窗口 中 ， 所 以 删除 子 窗口 时 ， 屏 幕 显 示 不 会 
发 生 任何 变化 。 

乍 看 起 来 ， 子 窗口 好 像 没有 用 处 。 为 何不 直接 在 父 窗口 中 修改 呢 ? 
子 窗口 最 主要 的 用 途 是 ， 提 供 了 一 种 简洁 的 方式 来 卷 动 另 一 窗口 里 的 部 
分 内 容 。 在 编写 curses 程 序 时 ， 我 们 经 常会 需要 卷 动 屏幕 的 某 个 小 区 
域 。 通 过 将 这 个 小 区 域 定义 为 一 个 子 窗口 ， 然 后 对 其 进行 卷 动 ， 就 能 达 
到 我 们 想 要 的 效果 。 


使 用 子 窗口 有 个 强加 的 限制 : 在 应 用 程序 刷新 屏幕 之 前 必须 先 
对 其 父 窗口 调用 touchwin 函 数 。 


X E 子 窗口 

现在 你 已 看 到 了 这 些 新 函数 ， 下 面 这 个 简短 的 例子 将 显示 它们 是 如 
何 工作 的 ， 以 及 它们 与 先前 使 用 的 窗口 函数 有 何不 同 。 
窗口 的 显示 : 


(2) 现在 创建 一 个 新 的 卷 动 子 窗口 。 根 据 前 面 的 建议 ， 必 须 在 刷 
新 屏幕 之 前 对 父 窗口 调用 touchwin 函 数 : 


(3) 接 下 来 ， 删 除 子 究 口中 的 内 容 ， 重 新 输出 一 些 文 字 ， 然 后 刷 
新 它 。 滚 动 文 本 是 通过 loop 循 环 来 实现 的 : 


(4) 循环 结束 后 ， 删 除 子 窗口 ， 然 后 再 次 刷新 基本 屏幕 : 


图 6-6 是 程序 执行 结束 后 ， 你 看 到 的 屏幕 显示 情况 。 
实验 解析 
在 安排 指针 sub_window_ptr 指 向 subwin 函 数 调 用 的 结果 后 ， 把 子 窗 


口 设置 为 可 卷 动 。 即 使 在 删除 了 子 窗口 和 重新 刷新 了 基本 窗口 
(stdscr) 之 后 ， 屏 幕 上 的 文本 依然 保持 原来 的 样子 ， 这 是 因为 子 窗口 
实际 更 新 的 是 stdscr 中 的 字符 数据 。 


rick@localhost:~/bipde/cho6 
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6.7__keypad* x\ 


你 已 看 到 curses 提 供 的 一 些 用 于 处 理 键盘 的 功能 。 一 般 键 盘 至 少 都 
会 包 侣 方 癌 键 和 功能 键 ， 许 多 键盘 还 带 有 数字 小 键盘 以 及 诸如 Insert、 
Home 等 其 他 按键 。 

对 于 大 多 数 终端 来 说 ， 解 码 这 些 按键 是 一 件 很 困难 的 事 ， 因 为 它们 
往往 会 发 送 以 escape 字 符 开 头 的 字符 串 序 列 。 应 用 程序 不 仅 要 区 分 “单独 
按 下 Escape 键 和“ 按 下 某 个 功能 键 而 生成 的 以 Escape 字 符 开 头 的 字符 串 
Hee 还 必须 处 理 不 同 的 终端 对 于 同一 逻辑 按键 使 用 不 同 字 符 串 序列 
J 情况 。 

幸运 的 是 ，curses 函 数 库 提供 了 一 个 精巧 的 用 于 管理 功能 键 的 功 
能 。 对 每 个 终端 来 说 ， 它 的 每 个 功能 键 所 对 应 的 转 义 序列 都 被 保存 ， 通 
党 是 保存 在 一 个 terminfo 结 构 中 ， 而 头 文 件 curses. h 通 过 一 组 以 KEY 为 
前 级 的 定义 来 管理 逻辑 键 。 

curses 在 启动 时 会 关闭 转 义 序列 与 逻辑 键 之 间 的 转换 功能 ， 该 功能 
ee 该 函数 调用 成 功 时 ， 返 回 OK， 人 否则 
WR PIERR 


#include <curses.h> 


int keypad(WINDOW *window_ptr, bool keypad on); 


将 keypad_on 参 数 设 置 为 tue， 然 后 调用 keypad 函 数 来 启用 keypad 模 
式 。 在 该 模式 中 ，curses 将 接管 按键 转 义 序列 的 处 理工 作 ， 读 键盘 操作 
不 仅 能 够 返回 用 户 按 下 的 键 ， 还 将 返回 与 巡 辑 按键 对 应 的 KEY_ 定 义 。 
使 用 keypad 模 式 有 下 面 3 个 小 小 的 限制 。 
O “识别 escape 转 义 序 列 的 过 程 是 与 时 间 相 关 的 。 许 多 网 络 协议 会 
将 字符 组 合成 数据 包 〈 这 将 导致 escape 转 义 序 列 的 识别 不 准确 ) ， 
或 者 是 将 字符 串 分 割 开 《这 将 导致 功能 键 的 转 义 序列 有 可 能 被 识别 
为 一 个 单独 的 Escape 按 键 和 其 他 独立 的 字符 串 ) 。 这 种 情况 在 广 域 
网 和 其 他 慢 速 链 路 上 将 更 为 严重 。 这 一 问题 的 唯一 解决 方法 是 设法 
对 终端 进行 编程 ， 让 它 针对 用 户 希 望 使 用 的 每 个 功能 键 只 发 送 一 个 
单独 的 、 唯 一 的 字符 ， 虽 然 这 将 限制 可 使 用 的 控制 字符 的 数目 。 
O “为 了 让 curses 能 够 区 分 “单独 按 下 Escape 键 ?和 “一 个 以 Escape 字 符 
开头 的 键盘 转 义 序列 ”， 它 必须 等 待 一 小 段 时 间 。 有 时 候 ， 在 局 用 
了 keypad 模 式 后 ， 处 理 Escape 按 键 所 造成 的 非常 细微 的 延 时 都 可 能 


会 被 注意 到 。 

O “curses 不 能 处 理 二 义 性 的 escape 转 义 序列 。 如 果 终 端 上 两 个 不 同 
的 按键 会 产生 完全 相同 的 转 义 序列 ，curses 将 不 会 处 理 这 个 转 义 序 
列 ， 因 为 它 不 知道 该 返回 哪个 逻辑 按键 。 


实 验 使 用 keypad 模 式 OO 
个 程序 时 ， 按 下 Esc 按键 并 注意 观察 细微 的 延 时 。 程 序 将 在 这 段 延 时 里 


判断 这 个 Esc 是 一 个 escape 转 义 序 列 的 开头 还 是 一 个 单独 的 按键 : 
(1) 首先 对 程序 和 curses 函 数 库 进 行 初始 化 ， 然 后 局 用 keypad 模 
SX: 


(2) 接 下 来 ， 关 闭 回 显 功能 以 防止 光标 在 你 按 下 方向 键 时 发 生 移 
动 。 然 后 清 屏 并 显示 一 些 文本 。 程 序 将 等 竺 用 户 的 击 键 动作 ， 除 非 用 户 
的 按键 是 字母 Q 或 发 生 了 错误 ， 否 则 按键 所 对 应 的 字符 将 显示 在 屏幕 
人 就 把 这 个 转 义 序列 显示 在 屏 
fr Ts 


endwin (} 


实验 解析 

在 启用 keypad 模 式 之 后 ， 你 看 到 了 该 模式 是 如 何 识别 键盘 上 的 各 种 
其 他 按键 的 ， 这 些 按键 都 将 生成 escape 转 义 序列 。 你 还 将 注意 到 Escape 
键 的 检测 要 上 略 慢 于 其 他 按键 。 


6.8” 彩 位 显示 


以 前 ， 只 有 极 少 数 的 中 终端 支持 彩色 显示 功能 ， 所 以 大 多 数 早 期 的 
curses 水 数 库 都 不 支持 色彩 。 如 今 ，ncurses 和 其 他 大 多 数 现代 的 curses 实 
现 版 本 都 提供 了 对 它 的 文 持 。 但 遗憾 的 是 ，curses 函 数 库 的 “ 哑 屏 幕 " 青 
景 影响 了 其 API，curses 只 能 以 一 种 非常 受 限 的 方式 来 使 用 彩色 ， 这 反映 
了 早期 彩色 终端 显示 色彩 能 力 的 缺乏 。 

屏幕 上 的 每 个 字符 位 置 都 可 以 从 多 种 颜色 中 选择 一 种 作为 它 的 前 景 
色 或 背景 色 。 例 如 ， 你 可 以 在 红色 背景 上 写 绿色 的 文本 。 

curses 函 数 库 对 颜色 的 文 持 有 些 与 众 不 同 ， 即 字符 颜色 的 定义 及 其 
背景 色 的 定义 并 不 完全 独立 。 你 必须 同时 定义 一 个 字符 的 前 景色 和 背景 
色 ， 我 们 将 它 称 之 为 颜色 组 合 (color pair) 。 

在 使 用 curses 函 数 库 的 颜色 功能 之 前 ， 你 必须 检查 当前 终端 是 否 文 
持 彩 色 显 示 功 能 ， 然 后 对 curses 的 闫 色 例 程 进行 初始 化 。 为 完成 这 个 任 
务 ， 你 需要 使 用 两 个 函数 : has_colors 和 start_color: 


#include <curses.h> 


bool has_colors (void); 
int start_color(void); 


如 果 终 端 支持 彩色 显示 ，has_colors 函 数 将 返回 true。 然 后 ， 你 需要 
调用 start_color 函 数 ， 如 果 该 函数 成 功 初 始 化 了 颜色 显示 功能 ， 它 将 返 
回 OK。 一 旦 start_color 函 数 被 成 功 调用 ， 变 量 COLOR_PAIRS 将 被 设置 
为 终端 所 能 文 持 的 颜色 组 合 数目 的 最 大 值 ， 一 般 常 见 的 最 大 值 为 64。 变 
量 COLORS 定 义 可 用 颜色 数目 的 最 大 值 ， 一 般 只 有 8 种 。 在 内 部 实现 
中 ， 每 种 可 用 的 颜色 以 一 个 从 0 到 63 的 数字 作为 其 唯一 的 ID 号 。 

在 把 颜色 作为 属性 使 用 之 前 ， 你 必须 首先 调用 init_pair 函 数 对 准备 
ee 对 两 色 属 性 的 访问 是 通过 COLOR_PAIR 函 

TU ye 


#include <curses.h> 


int init pair(short pair number, short foreground, short background); 
int COLOR_PAIR{int pair number); 
int pair_content(short pair_number, short *foreground, short *background); 


L M/F curses. hil Fi 2 Ee HEA, EMN 4 LACOLOR_A 
前 缀 。 另 外 还 有 个 函数 pair_content， 它 的 作用 是 获取 已 定义 的 颜色 组 合 


的 信息 。 下 面 的 i sh 


R_RE 


ey epee 数 ， 将 该 颜色 组 合作 为 属性 来 访 
问 : 


上面 这 条 语句 的 作用 是 把 屏 异 幕 上 后 续 添加 的 内 容 设 置 为 绿色 背景 
的 红色 内 容 。 

因为 一 个 COLOR_PAIR 束 是 一 个 属性 ， 所 以 可 以 把 它 与 其 他 属性 结 
合 起 来 。 在 个 人 电脑 上 ， 你 通常 通过 “ 按 位 或 ”将 COLOR_PAIR 属 性 和 附 
sl aA a 


下 而 过 示例 程序 colorc 来 查看 这 些 于 数 的 使 用 情况 


实 验 彩色 
C1) 首先 检查 这 个 程序 的 显示 终端 是 否 文 持 彩色 显示 ， 如 果 文 
持 ， 就 启用 彩色 显示 : 


<stdiib.i 
èe <stdi h> 


C2) BREE, PREJ AFT EW H 4 oii FY FS 6, BC RAER CAIA 
色 组 合 的 最 大 值 。 然 后 ， 程 序 创 建 7 个 颜色 组 合并 一 次 显示 一 个 : 


r(i, COLOR_RED, COLOR_BLACK); 


init_pair(6, COLOR 
init_pair(7, COLOR_CYAN, COLOR_WHITE) ; 


for (i = 1; i <= 7; i 
attroff (A_BOLD); 
attrset (COLOR_PAIR(i)); 
mvprintw(5 + i, 5, “Color pair td", i); 
attrset (COLOR_PAIR(i A_BOLD) ; 
mvprintw(5 + i, 25, “Bold color pair $d*, i); 
refresh(); 


sleep(i); 


endwin(); 
exit (EXIT_SUCCESS) ; 


这 个 示例 程序 给 出 如 图 6-7 所 示 的 输出 结果 ， 图 中 缺少 了 实际 的 色 
彩 ， 这 是 当然 的 ， 因 为 这 是 一 张 黑白 的 屏 磊 截 图 。 
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There are 8 COLORS, and 64 COLOR PAIRS available 
Color pair 1 Bold color pair 1 


Color pair 4 Bold color ra 
Color pair è Bold color 6 


实验 解析 

在 检查 确认 屏幕 支持 彩色 显示 之 后 ， 程 序 初始 化 颜色 处 理 并 定义 了 
一 些 颜 色 组 合 。 然 后 ， 程 序 使 用 这 些 颜色 组 合 将 一 些 文本 写 到 屏幕 上 ， 
以 显示 不 同 颜色 组 合 的 效果 。 


重新 定义 颜色 
早期 的 哑 终 端 同一 时 间 只 能 显示 非常 有 限 的 颜色 种 类 ， 但 允许 用 户 
对 可 用 的 颜色 集 进行 配置 ， 出 于 对 这 类 终 靖 的 文 持 考虑 ，curses 函 数 库 


可 通过 init_color 函 数 对 颜色 进行 重新 定义 : 
#include <curses.h> 


int init_color(short color_number, short red, short green, short blue); 

这 个 函数 可 以 将 一 个 已 有 的 颜色 《范围 从 0 到 COLORS ) 以 新 的 亮 
度 值 重 新 定义 ， 亮 度 值 的 范围 从 0 到 1 000。 这 有 点 像 为 GIF 格式 的 图 片 
定义 颜色 值 。 


6.9 pad 


在 编写 更 高 级 的 curses 程 序 时 ， 有 时 需要 先 建立 一 个 多 辑 屏幕 ， 然 
后 再 把 它 的 全 部 或 部 分 内 容 输出 到 物理 屏 医 上 。 有 时 候 ， 如 果 能 有 一 个 
矿 寸 大 于 物理 屏幕 的 逻辑 屏幕 ， 一 次 只 显示 该 逻辑 屏 萌 的 某 个 部 分 ， 其 
效果 往往 会 更 好 。 

但 使 用 到 目前 为 止 所 学 过 的 curses 函 数 来 实现 这 一 功能 并 不 容易 ， 
因为 任何 窗口 的 尺寸 都 不 能 大 于 物理 屏幕 。curses 提 供 了 一 个 特殊 的 数 
据 结 构 pad 来 解决 这 一 问题 ， 它 可 以 控制 尺寸 大 于 正常 窗口 的 逻辑 屏 
FF 


”pad 结构 非常 类 似 WINDOW 结 构 ， 所 有 执行 写 窗口 操作 的 curses 函 
数 同样 可 用 于 pad。pad 还 有 其 自己 的 创建 函数 和 刷新 函数 。 
创建 pad 的 方式 与 创建 正常 窗口 的 方式 基本 相同 : 


#include <curses.h> 


WINDOW *newpad(int number of lines, int number of columns); 


需要 注意 的 是 ， 这 个 函数 的 返回 值 是 一 个 指 回 WINDOW 结 构 的 指 
针 ， 这 一 点 与 hewwin 隙 数 相 同 。pad 用 delwin 函 数 来 删除 ， 这 与 正常 窗 
口 的 删除 一 样 。 

pad 使 用 不 同 的 函数 执行 刷新 操作 。 因 为 一 个 pad 并 不 局 限于 某 个 特 
定 的 屏幕 位 置 ， 所 以 必须 指定 希望 放 到 屏幕 上 的 pad 范 围 及 其 放置 在 屏 
幕 上 的 位 置 。prefresh 函 数 用 于 完成 这 一 功能 : 


#include <curses.h> 


int prefresh(WINDOW *pad ptr, int pad row, int pad _ column, 
int screen_row_min, int screen col min, 
int screen_row_max, int screen_col max); 


这 个 函数 的 作用 是 将 pad 从 坐标 Cpad_row, pad.column) 开始 的 区 域 
写 到 屏幕 上 指定 的 显示 区 域 ， 该 显 不 区 域 的 范围 从 坐标 
(screen_row_min, screen_col_min) 到 
(screen_row_max,screen_col_max) 。 
cursesii fe fit T eki{pnoutrefresh, “A/F AA 5 ek Bcwnoutrefresh— 
样 ， 都 是 为 了 更 有 效 地 更 新 屏幕 。 
我 们 通过 程序 pad.c 来 查看 这 些 函 数 的 使 用 方法 。 


So 验 使 用 pad 
(1) 在 程序 的 开始 首先 初始 化 pad 结 构 ， 然 后 创建 一 个 pad， 创 建 


pad 的 函数 将 返回 一 个 指向 该 pad 的 指针 。 用 字符 填充 这 个 pad 结 构 〈 它 
比 终端 显示 区 域 的 长 度 及 宽度 各 多 出 50 个 字符 ) : 


tinclude <stdlib.h> 
tinclude <curses.h> 


int main{) 

{ 
WINDOW *pad_ptr; 
int x, y? 
int pad lines; 
int pad_cols; 
char disp_char; 


initser(); 
pad, 


Or 
Q; 


= LINES 


= COLS + 50; 


paä cols 

pad ptr = newpad(pad_lines, pad_cols}; 
disp_char = ‘a‘; 

for (x = 0; x < pad_lines; x++) ( 


for (y = 0; y < pad_cols; yee) { 
myvwaddchipad ptr, x, y., disp char); 
if (disp char == ‘z') disp_char = ‘a'; 
else disp_char++; 


(2) 现在 将 pad 的 不 同 区 域 绘制 到 屏 硕 的 不 同位 置 上 ， 然 后 结束 程 


~ 


prefresh(pad ptr, 5. 7, 2, 2, 9, 9); 
sleep(l); 

prefreshipad_ ptr, LINES + 5, COLS + 7, 5, 5, 
sleep(l); 

delwin{pad_ptr}); 

endwin(); 

exit (EXIT_SUCCESS) ; 


运行 这 个 程序 ， 你 将 看 到 如 图 6-8 所 示 的 输出 结果 。 
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6.10 CD 唱片 应 用 程 户 


现在 ， 你 已 学 习 完 curses 函 数 库 提 供 的 功能 ， 下 面 可 以 开发 一 个 样 
本 应 用 程序 了 。 下 面 的 C 语 言 版 本 的 样本 程序 使 用 了 curses 函 数 库 ， 这 使 
ee 


”整个 应 用 程序 长 达 8 页 ， 所 以 我 们 将 其 分 割 为 几 个 部 分 。 完 整 的 源 
代码 curses_app.c 可 以 从 Wrox 出 版 社 的 Web 站 点 上 获取 。 这 个 程序 与 本 
书 中 的 其 他 程序 一 样 ， 都 遵循 GNU 公 共 许 可 证 。 


CD 数据 库 应 用 程序 的 这 个 版 本 使 用 了 前 面 革 节 所 提供 的 信 
晨 。 它 源 于 第 2 半 里 的 shell 肢 本 程序 。 我 们 并 未 针对 C 语 言 实 现 版 
本 对 该 程序 进行 重新 设计 ， 所 以 你 还 可 以 从 这 个 版 本 中 看 到 很 多 
原来 shell 脚 本 的 特征 。 要 注意 的 是 ， 这 个 实现 版 本 还 有 一 些 明显 
的 不 足 ， 我 们 将 在 后 面 的 修订 版 本 中 加 以 解决 。 


我 们 将 这 个 应 用 程序 的 代码 分 割 为 几 个 部 分 ， 并 以 下 面 各 小 市 的 标 
题 加 以 说 明 。 这 里 所 使 用 的 代码 编排 规定 与 本 书 的 其 他 部 分 不 太一 样 ， 
在 这 里 ， 阴 影 部 分 的 代码 只 用 于 显示 对 应 用 程序 里 其 他 函数 的 调用 。 


6.10.1 新 CD 唱片 应 用 程序 毕 Ly sat LN 


代码 的 第 一 部 分 只 用 于 声明 将 在 后 面 用 到 的 变量 和 函数 ， 并 初始 化 
一 些 数 据 结 构 : 
(1) 首先 ， 包 含 所 有 必需 的 头 文件 ， 并 定义 一 些 全 局 常量 : 


(2) 现在， 需要 定义 一 些 全 局 变量 。 变 量 current_cd 用 于 保存 正在 
处 理 的 当前 CD 唱片 的 标题 。 该 变量 的 第 一 个 字符 被 初始 化 为 空 字符 


null， 表 示 用 户 还 未 选择 CD 唱片 。\ 0 并 不 是 绝对 必需 的 ， 但 它 能 确保 
该 变量 被 切 始 化 了 ， 而 这 通常 是 件 好 事 。 变 量 current_cat 用 于 记录 当前 
CD 唱 Os 


(3) ) 接 下 来 是 一 些 文件 名 的 声明 。 为 简单 起 见 ， 这 个 版 本 中 的 文 
件 名 都 是 固定 的 ， 临 时 文件 的 文件 名 也 是 如 此 。 


但 如 果 有 两 个 用 户 在 同一 目录 下 同时 运行 这 个 程序 ， 就 会 出 
现 问题 。 获 得 数据 库 文 件 名 的 更 好 方法 是 通过 程序 的 参数 或 是 环 
境 变 量 。 我 们 也 需要 一 种 更 好 的 方法 来 生成 一 个 唯一 的 临时 文件 
名 ， 这 可 以 通过 POSIX 的 tmpnam 函 数 来 完成 。 我 们 将 在 第 8 章 使 
用 MySQL 存 储 数据 时 解决 这 些 问题 。 


“(4) 最 后 ， 给 出 所 有 函数 的 原型 定义 : 


void update _cd(void); 


(5) 在 查看 这 些 函 数 的 具体 实现 之 前 ， 你 需要 定义 一 agin 
(实际 上 是 一 个 菜单 选项 的 数组 ) 6 4S ET RE AY, FoR 
个 字符 将 被 返 回 。 例如 ， 如 果 荣 单 选 项 是 Add New CD， 那么 当 这 个 选 
项 被 选中 时 ， 字 符 a 将 被 返回 。 当 用 户 选 中 一 张 CD 唱 片 后 ， 扩 展 的 荣 单 
选项 extended_menu 将 被 显示 : 


char *main_menu[] = 


"add new CD", 

*find CD’, 

"count CDs and tracks in the catalog", 
"quit", 

0, 


}; 


char *extended_menu[] = 

{ 
“add new CD", 
*find CD‘, 
*count CDs and tracks in the catalog’, 
*list tracks on current CD", 
"remove current CD", 
*update track information", 
*quit*, 
0, 

): 


上 面 的 内 容 结束 了 程序 的 初始 化 过 程 。 接 下 来 ， 可 以 开始 进入 程序 
中 的 函数 了 。 但 首先 ， 需 要 了 解 这 些 函 数 之 间 的 相互 关系 ， 如 图 6-9 所 
JR, AH 16TA, 分 为 如 下 3 类 : 

O “绘制 菜单 

口 将 CD 唱片 资料 添加 到 数据 库 中 

O 获取 和 显示 CD 唱 es 


GET_CHOICE eT 
DRAW_MENL 


REMOVE CD UPDATE_CD 
REMOVE_TRACKS 


Le 


INSERT_TITLE 


G v T_STRING GET_CONFIRM 


CLEAR_ALL_SCREEN 


6.10.2 main 函数 


main 函 数 多 许 用 户 从 沫 单 中 进行 选择 ， 直 到 选中 quit《〈 退 出 ) 为 
止 ， 如 下 所 示 : 


下 面 我 们 分 别 对 程序 中 的 3 类 函数 进行 分 析 。 
6.10.3 ”建立 菜单 


本 节 查 看 与 程序 的 用 户 接 口 相关 的 3 个 函数 。 

(1) main 函 数 调 用 的 getchoice PR AN ce ASH AY FE EE PRIA. getchoice P&I 
数 的 参数 有 : greet 介绍 信息 ，choices fa la) ES LB ESE FE 
(这 取决 于 用 户 是 否 选 择 了 一 张 CD 唱 卢 ) 。 你 可 以 在 前 面 的 main 函 数 
中 看 到 main_menu 或 extended_menu 是 如 何 作 为 参数 传递 的 : 


int getchoice(char *greet, char *choices[) 
{ 
Static int selected_row = 0; 
int max_row = 0; 
int start_screenrow = MESSAGE_LINE, start_screencol = 10; 
char **option; 
int selected; 
int key = 0; 


option = choices; 
while (*option) [ 
max_row++; 
option++; 
} 
/* protect against menu getting shorter when CD deleted */ 
if (selected_row >= max_row) 
selected_row = 0: 
clear_all_screen(); 
mvprintwistart_screenrow - 2, start_screencol, greet); 
keypad(stdscr, TRUE); 
ebreak(); 
noecho() ; 
key = 0; 
while (key != 'q' && key !* KEY ENTER && key != ‘\n') 
if (key == KEY_UP) [ 
if [selected row == 0) 
selected_row = max row ~ 1; 
else 
selected_row--; 
} 
if (key == KEY_DOWN) ( 
if (selected_row = 
selected_row = 0; 
else 
selected_row++; 
} 
selected = ‘choices[selected_row]; 
draw_menu(choices, selected_row, start_screenrow, 
start_screencol); 
key = getch(}; 


} 

keypadistdscr, FALSE); 
nocbreak(); 

echo(); 

if (key == 'q') 


return (selected); 


(2) getchoice 函 数 内 部 调用 了 两 个 函数 : clear_all_screen#ll 
draw_menu. RIJEKA E draw_menupk žit: 


nt current_highlight, 


(3) 接 下 来 是 clear_all_screen 函 数 ， 让 人 惊讶 的 是 ， 它 只 是 清 屏 并 
里 号 软件 标题 。 如 果 用 户 选 中 了 一 张 CD 唱 片 ， 则 在 屏幕 上 显示 它 的 信 


void clear_all_screen 


6.10.4 ”操作 数据 库 文件 


本 市 介绍 用 于 添加 或 更 新 CD 数据 库 的 函数 。 被 main 函 数 调 用 的 函 
数 有 : add_record、update_cd 和 remove_cd。 
1. 添加 记录 
(1 1 eit 张 新 CD 唱 片 的 资料 到 数据 库 : 


char cd_title[(MAX_STRING] ; 
char cd_type[MAX_ ? 
char cd_artise [NAX_ ] 
char cd entry [MAX_STRING); 


int screenrow = MESSAGE_LINE; 


int screenco. 


clear_all_screen(); 

mvprintw(screenrow, screencol, “Enter new CD details”); 
Screenrow + 

mvprintw(screenrow, screencol, “Catalog Number: 
get_string(catalog_number) ; 


screenrowes ; 


mBvprintwiscreenrow, screencoi, DT 
get_string(cd_title); 

screenrowse+; 

mvprintwiscreenrow, screencol, * SD Type: °}; 
get_stringicd_type); 

Screenrowes ; 

mvprintwiscreenrow, screencol č Artist 


pr 
get_string(cd_artist}; 


screenrows+; 


move |PROMPT_LINE, 0); 

af (get_confirm()) { 
insert_title(cd_entry); 
strcpy (current cd, cd title); 


strcpy (current cat, catalog nusber) ; 


(2) ”get_string 函 数 的 作用 是 从 屏幕 当前 位 置 读 取 一 个 字符 串 ， 并 
将 其 末尾 可 能 存在 的 新 行 符 删除 : 
void get_stringichar *string) 


wgetnstr(stdscr, string, MAX_STRING); 


(3) get_confirm 函 数据 示 并 读 取 用 户 的 确认 信息 ， 它 读 取 用 户 的 输入 字符 串 ， 恰 查 该 字符 串 的 


(3) ”get_confirm 函 数 提示 并 读 取 用 户 的 确认 信息 。 它 读 取 用 户 的 
得 入 字符 串 ， 检 查 该 字符 串 的 第 一 个 字符 是 侣 是 Y 或 Y， 如 宋 是 其 他 字 
符 ， 则 认为 用 户 未 确认 : 


(4) a, BADR Ainsert_titlers§ 20. € REH et biel FFT BS 
加 到 标题 文件 的 末尾 ， 从 而 在 CD 数据 库 中 添加 一 个 标题 记录 : 


2. 更 新 记录 

(1) main PK A HHI 93“ OC ee TE PA Ce update_ 这 个 函数 
使 用 了 一 个 带 边 框 、 可 卷 屏 的 子 窗口 ， 它 和 需要 用 到 一 些 秆 由 于 这 些 
ae tracks kl BC FESH, Pp ae ee ay 量 被 定义 为 全 局 党 


RES 


(2) neg cd 函数 允许 用 户 重 新 输入 当前 CD 唱片 中 的 曲目 。 在 
删除 以 前 的 曲目 记录 后 ， 它 会 提示 用 户 输入 新 资料 : 


我 们 将 在 下 面 继续 列 出 这 个 函数 的 剩余 代码 。 在 这 里 ， 我 们 
稍 作 停顿 ， 解 释 一 下 如 何在 带 边 框 的 卷 屏 窗 口中 输入 数据 。 这 里 
使 用 的 技巧 是 先 创 建 一 个 子 窗口 ， 围 绕 它 画 一 个 边框 ， 然 后 在 这 
个 融 边 框 的 子 窗口 中 再 谎 加 一 个 新 的 卷 屏 子 窗口 。 


3. 删 除 记 录 
(1) main 函 数 调用 的 最 后 一 个 操作 数据 库 的 函数 是 remove_cd: 


(2) 现在 ， 只 需要 列 出 remove_tracks 函 数 。 该 函数 的 作用 是 删除 
当前 CD 唱片 中 的 曲目 记录 。 它 同时 被 update_cd 函 数 和 remove_cd 函 数 调 
用 : 


6.10.5 ”查询 CD 数据 库 


本 市 介绍 如 何 访问 数据 ， 为 便于 访问 ， 数 据 被 存储 在 一 对 平面 文件 
中 ， 并 以 逗号 作为 字段 的 分 阳 符 : 

C1) 所 有 收集 嗜好 的 本 质 都 是 为 了 了 解 你 收集 的 东西 数量 有 多 
少 。 下 面 这 个 函数 束 是 用 来 执行 这 个 任务 的 。 它 对 数据 库 进行 扫描 并 统 
计 出 总 的 唱片 数目 和 曲目 数 : 


count cds 


y ks_fr 


tracks++ 


get_return{); 


(2) 如 果 不 小 心 将 最 喜欢 的 CD 唱片 的 标签 弄 丢 了 ， 不 用 担心 ! 由 
于 已 经 将 CD 唱片 的 详细 信息 录入 数据 库 ， 所 以 可 以 通过 调用 find_cd 函 
数 来 查找 曲目 清单 。 它 提示 用 户 输入 一 个 字符 串 ， 根 据 该 字符 串 在 数据 
a 匹配 检索 ， 并 把 找到 的 CD 唱片 标题 放 入 全 局 变量 current_cd 


har match[ MAX RING entr MAX ENTRY 


虽然 catalog 指 向 的 数组 比 current_cat 要 大 ， 并 且 很 可 能 会 覆盖 内 
存 ， 但 在 fgets 疯 数 中 的 检查 就 不 会 发 生 上 述 问 题 。 
(3) 还 需要 把 用 户 选 中 的 CD 唱 厂 中 的 曲目 列 在 屏 大 上 。 这 里 会 用 
到 在 上 一 小 节 中 为 update_cd 函 数 中 的 子 窗口 使 用 所 定义 的 全 局 常量 : 


mvprintwi4é, 0, “CD Track Listing\n"); 


/* write the track information into the pad */ 
while (fgets(entry, MAX_ENTRY, tracks_fp}) { 

/* Compare catalog number and output rest of entry */ 
(strncmp(current_cat, entry, cat_length) == 0) ( 
mvwprintw(track_pad_ptr, lines_op++, 0, “%s* 

entry 4 cat_length + 1); 


j+ 
if 
++ 


} 
fclose(tracks_fp) ; 


if (lines_op > BOXED_LINES) { 

mvprintw{(MESSAGE_LINE, 0, 

“Cursor keys to scroll, RETURN or q to exit"); 

} else { 

mvprintw(MESSAGE_LINE, 0, “RETURN or q to exit’); 
} 
wrefresh(stdscr}; 
keypad(stdscr, TRUE); 


chreak({); 

noecho(); 

key = 0; 

while (key != 'q' && key != KEY_ENTER && key != '\n') { 


if (key == KEY_UP) { 
if (first_line > 0) 
first_line--; 


} 
if (key == KEY_DOWN} ( 
if (first_line + BOXED_LINES + 1 < tracks) 
first_linese; 


/* now draw the appropriate part of the pad on the screen */ 
prefresh(track_pad ptr, first_line, 0, 
BOX_LINE_POS, BOX_ROW_POS, 
BOX_LINE_POS + BOXED_LINES, BOX_ROW_POS + BOXED ROWS); 
key = getch(}; 
} 


delwin(track_pad_ptr) ; 
keypad(stdscr, FALSE); 
nocbreak(}; 

echo(}; 


(4) 前 面 两 个 函数 都 调用 了 get_returmn 函 数 ， 它 的 作用 是 提示 用 户 
按 下 回 车 键 并 读 取 它 ， 其 他 字符 将 被 忽略 : 


void get_return() 
{ 


int ch; 
mvprintw(23, 0, *ts*, ° Press return °); 


refresh(); 
while ((ch = getchar()) != ‘\n' && ch != BOF); 


运行 这 个 程序 ， 你 将 看 到 如 图 6-10 所 示 的 输出 结果 。 
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图 6-10 


6.11 小 结 


在 本 章 中 ， 我 们 介绍 了 curses 函 数 库 。curses 为 基于 文本 的 程序 提供 
了 控制 屏幕 和 读 取 键盘 输入 的 好 方法 。 与 通用 终端 接口 CGTD 和 直接 
terminfo 数 据 库 访问 相 比 ， 虽 然 curses 并 未 提供 那么 多 的 控制 功能 ， 但 它 
更 易于 使 用 。 如 果 你 正在 编写 一 个 全 屏 的 、 基 于 文本 的 应 用 程序 ， 就 应 
该 考虑 使 用 curses 函 数 库 来 管理 屏幕 和 键盘 。 


在 前 面 的 音节 中 ， 我 们 介绍 了 资源 限制 的 问题 。 在 本 章 中 ， 我 们 
将 首先 介绍 资源 分 配 的 管理 方式 ， 然 后 介绍 如 何 对 可 能 被 多 个 用 户 同 时 
访问 的 文件 进行 处 理 ， 最 后 介绍 一 个 Linux 系 统 提供 的 工具 ， 我 们 可 以 
利用 它 来 元 服 以 普通 文件 作为 数据 存 贮 介质 时 受到 的 限制 。 

我 们 可 将 这 些 问题 归纳 为 数据 管理 的 3 个 方面 。 

口 动态 内 存 管理 : 可 以 做 什么 以 及 Linux 不 允许 做 什么 。 

O 文件 锁定 : 协调 锁 、 共 享 文件 的 锁定 区 域 和 避免 死 锁 。 

口 _dbm 数 据 库 : 一 个 大 多 数 Linux 系 统 都 提供 的 、 基 本 的 、 不 基于 

SQL 的 数据 库 函 数 库 。 


7.1 ise: 


FEAT RALASH, AER. wae Pa AA 
存 ， 它 总 是 显得 不 够 。 在 过 去 ， 人 们 还 认为 256 MB 的 内 存 已 经 足够 
了 。 但 现在 ， 即 使 对 桌面 系统 ，2 GB 的 内 存 也 已 经 是 其 最 低 要 求 了 ， 服 
务 器 系统 通常 需要 的 内 存量 就 更 多 了 。 

从 最 早期 的 操作 系统 版 本 开始 ，UNIX 风 格 的 操作 系统 就 以 一 种 非 
常 干 净 的 方式 来 管理 内 存 ， 因 为 Linux 系 统 实现 了 X/Open 规 范 ， 所 以 它 
也 继承 了 这 一 特点 。 除 了 一 些 特殊 的 租 入 式 应 用 程序 以 外 ，Linux 程 序 
决 不 允许 直接 访问 物理 内 存 。 也 许 应 用 程序 看 起 来 好 像 可 以 这 样 做 ， 但 
应 用 程序 看 到 的 只 是 一 个 精心 控制 的 假象 而 已 。 

Linux 为 应 用 程序 提供 了 一 个 简洁 的 视图 ， 它 能 反映 一 个 巨大 的 可 
直接 寻 址 的 内 存 空间 。 此 外 ，Linux 还 提供 了 内 存 保护 机 制 ， 它 避免 了 
不 同 的 应 用 程序 之 间 的 互相 干扰 。 如 果 机 器 被 正确 配置 并 且 有 足够 的 交 
换 空 间 ，Linux 还 允许 应 用 程序 访问 比 实 际 物理 内 存 更 大 的 内 存 空 间 。 


7.1.1 fay 分 配 
使 用 标准 C 语 言 函 数 库 中 的 malloc 调 用 来 分 配 内 存 : 


#include <stdlib.h> 
void *malloc(size_t size); 


注意 ， 遵 循 X/Open 规 范 的 Linux 与 一 些 UNIX 系 统 不 同 ， 它 不 要 
求 包含 malloc.h 头 文件 。 此 外 ， 用 来 指定 待 分配 内 存 字 节 数 量 的 参 
数 size 不 是 一 个 简单 的 整 型 ， 虽 然 它 通常 是 一 个 无 符号 整 型 。 


你 可 以 在 大 多 数 Linux 系 统 上 分 配 大 量 的 内 存 。 让 我 们 从 一 个 非常 
简单 的 例子 开始 ， 但 这 个 例子 却 足 以 打败 旧式 的 基于 MS-DOS 的 程序 ， 
因为 在 DOS 下 的 程序 不 能 访问 超过 640 多 内 存 映 射 限 制 的 内 存 范 围 。 


K 验 简单 的 内 存 分 配 
输入 下 面 这 个 程序 memory1l.c: 


memory; 


运行 这 个 程序 时 ， 它 的 输出 如 下 所 示 : 


memoryl 


实验 解析 

这 个 程序 要 求 malloc 隙 数 给 它 返 回 一 个 指 问 IMB 内 存 空间 的 指针 。 
首先 检查 并 确保 malloc 函 数 被 成 功 调用 ， 然 后 通过 使 用 其 中 的 部 分 内 存 
来 表明 分 配 的 内 存 确实 已 经 存在 。 当 运行 这 个 程序 时 ， 你 会 看 到 程序 输 
出 Hello World， 这 表明 malloc 确 实 返 回 了 1MB 的 可 用 内 存 。 我 们 并 未 对 
这 个 1MB 的 空间 进行 全 面 检查 ， 对 于 malloc 调 用 的 代码 总 得 有 点 信任 
吧 ! 

注意 ， 由 于 malloc 函 数 返回 的 是 一 个 void* 指 针 ， 因 此 需要 通过 类 型 
转换 ， 将 其 转换 至 你 需要 的 char* 类 型 指针 。malloc 函 数 可 以 保证 其 返回 
的 内 存 是 地 址 对 齐 的 ， 所 以 它 可 以 被 转换 为 任何 类 型 的 指针 。 

可 以 这 样 做 的 原因 很 简单 ， 因 为 目前 大 多 数 Linux 系 统 都 使 用 32 位 
的 整数 和 32 位 的 指针 来 指向 内 存 ，32 位 的 指针 可 寻 址 的 地 址 空间 可 达 4 
GB。 系 统 直接 用 32 位 的 指针 来 寻 址 ， 而 不 再 需要 段 寄存 器 或 其 他 技巧 
的 能 力 被 称 为 32 位 平面 内 存 模 型 。 这 个 模型 还 被 用 于 32 位 版 本 的 
Windows XP 和 Vista 系 统 。 但 你 并 不 能 因此 认为 整数 永远 都 是 32 位 的 ， 
因为 正 有 越 来 越 多 的 64 位 Linux 版 本 投入 实际 使 用 。 


7.1.2 eRe 


现在 ， 你 已 经 看 到 Linux 能 轻松 打破 MS-DOS 内 存 模型 的 上 限 ， 我 们 
不 妨 给 它 出 个 更 难 的 题目 。 下 面 这 个 程序 将 请 求 系统 分 配 比 机 器 本 里 所 
拥有 的 物理 内 存 更 多 的 内 存 。 你 可 能 会 认为 ，malloc 会 在 接近 实际 物理 
内 存 容量 的 茶 个 地 方 出现 问 题 ， 因 为 内 核 和 其 他 运行 中 的 程序 也 会 占用 


部 分 内 存 。 


X 验 请 求全 部 的 物理 内 存 
在 程序 memory2.c 中 ， 我 们 将 请 求 比 机 器 物理 内 存 容量 更 多 的 内 
存 。 你 需要 根据 机 器 的 具体 情况 来 调整 宏 定义 PHY_MEM_MEGS: 


include <stdlib.h> 
include <stdio.h> 


这 个 程序 的 输出 如 下 所 示 ， 我 们 对 输出 结果 做 了 一 些 简化 : 

实验 解析 

这 个 程序 与 前 面 的 例子 十 分 类 似 。 它 只 是 通过 循环 来 不 断 申 请 越 来 
越 多 的 内 存 ， 直 到 它 已 分 配 了 在 PHY_MEM_MEGS 中 定义 的 物理 内 存 容 
量 的 2 倍 为 止 。 看 上 去 这 个 程序 似乎 耗 尽 了 机 器 上 物理 内 存 中 的 每 个 字 
节 ， 但 出 乎 意料 的 是 这 个 程序 竟然 运行 人 良好。 注意 ， 我 们 为 malloc 调 用 
的 参数 使 用 了 size_t 类 型 。 

男 一 个 有 趣 的 现象 是 ， 至 少 在 我 的 这 台 机 右上 ， 上 整个 程序 的 运行 时 
间 也 束 是 一 上 眼 的 功夫 。 也 就 是 说 ， 我 们 不 仅 很 明显 地 耗 尽 了 所 有 的 内 
存 ， 而 且 还 非常 快速 。 

我 们 用 程序 memory3.c 做 进一步 的 研究 ， 看 看 这 台 机 器 到 底 有 多 少 
内 存 可 以 分 配 。 因 为 现在 我 们 能 很 清楚 地 发 现 Linux 在 处 理 内 存 请 求 时 
表现 得 非常 聪明 ， 所 以 我 们 将 每 次 只 分 配 1K 字 节 的 内 存 并 在 获得 的 每 
个 内 存 块 上 写 入 数据 。 


sx 验 可 用 内 存 

下 面 就 是 程序 memory3.c 的 源 代 码 。 束 其 本 质 而 言 ， 这 个 程序 对 于 
系统 极 不 友好 ， 而 且 会 严重 影响 一 人 台 多 用 户 机 器 的 运行 。 如 果 对 可 能 的 
和 
孚 : 


这 一 次 ， 程 序 的 输出 如 下 《经 简化 ) : 


memory3 


然后 程序 就 结束 了 。 运 行 它 所 花费 的 时 间 还 不 少 ， 并 且 当 分 配 的 内 存 大 
小 接近 机 器 物理 内 存 容量 时 ， 运 行 速度 明显 慢 了 下 来 ， 而 且 你 能 很 明显 
地 感觉 到 硬盘 的 操作 。 但 这 个 程序 还 是 分 配 了 大 大 超出 机 器 物理 内 存 容 
量 的 内 存 。 最 后 ， 系 统 为 了 保护 自己 的 安全 运行 ， 终 止 了 这 个 贪 焚 的 程 
序 。 在 一 些 系统 中 ， 当 malloc 调 用 失败 时 ， 程 序 可 能 只 是 退出 而 不 输出 
任何 内 容 。 

实验 解析 

应 用 程序 所 分 配 的 内 存 是 由 Linux 内 核 管理 的 。 每 次 程序 请 求 内 存 
或 者 答 试 读 写 它 已 经 分 配 的 内 存 时 ， 便 会 由 Linux 内 核 接管 并 决定 如 何 
处 理 这 些 请 求 。 

刚 开 始 时 ， 内 核 只 是 通过 使 用 空闲 的 物理 内 存 来 满足 应 用 程序 的 内 
存 请 求 ， 但 是 当 物 理 内 存 耗 尽 时 ， 它 便 会 开始 使 用 所 谓 的 交换 空间 


(swap space) 。 在 Linux 系 统 中 ， 交 换 空间 是 一 个 在 安装 系统 时 分 配 的 
独立 的 磁盘 区 域 。 如 果 熟 悉 Windows 操 作 系 统 的 话 ，Linux 交 换 空 间 的 
作用 有 点 像 隐藏 的 Windows 交 换文 件 。 但 与 Windows 不 同 ，Linux 的 交换 
空间 中 没有 局 部 扒 、 全 局 扒 或 可 丢弃 内 存 段 等 需要 在 代码 中 操心 的 内 容 
Linux 内 核 会 为 你 完成 所 有 的 管理 工作 。 

内 核 会 在 物理 内 存 和 交换 空间 之 间 移 动 数据 和 程序 代码 ， 使 得 每 次 
读 写 内 存 时 ， 数 据 看 起 来 总 像 是 已 存在 于 物理 内 存 中 ， 而 不 管 在 你 访问 
它们 之 前 ， 它 们 究竟 是 在 哪里 。 

用 更 专业 的 术语 来 说 ，Linux 实 现 了 一 个 “ 按 需 换 页 的 虚拟 内 存 系 
统 ”。 用 户 程序 看 到 的 所 有 内 存 全 是 虚拟 的 ， 也 就 是 说 ， 它 并 不 真正 存 
在 于 程序 使 用 的 物理 地 址 上 。Linux 将 所 有 的 内 存 都 以 页 为 单位 进行 划 
分 ， 通 常 每 一 页 的 大 小 为 4096 字 节 。 每 当 程序 试图 访问 内 存 时 ， 就 会 发 
生 虚 拟 内 存 到 物理 内 存 的 转换 ， 转 换 的 具体 实现 和 耗费 的 时 间 取 决 于 你 
所 使 用 的 特定 硬件 情况 。 当 所 访问 的 内 存在 物理 上 并 不 存在 时 ， 就 会 产 
生 一 个 页 面 错误 并 将 控制 权 交 给 内 核 。 

Linux 内 核 会 对 访问 的 内 存 地 址 进行 检查 ， 如 果 这 个 地 址 对 于 程序 
来 说 是 合法 可 用 的 ， 内 核 就 会 确定 需要 问 程 序 提供 哪 一 个 物理 内 存 页 
面 。 然 后 ， 如 果 该 页 面 之 前 从 未 被 写 入 过 ， 内 核 就 直接 分 配 它 ， 如 果 它 
己 经 被 保存 在 人 硬盘 的 交换 空间 上 ， 内 核 束 读 取 包 含 数 据 的 内 存 页 面 到 物 
理 内 存 〈 可 能 需要 把 一 个 已 有 页 面 从 内 存 中 移出 到 硬盘 ) 。 接 着 ， 在 完 
成 虚拟 内 存 地 址 到 物理 地 址 的 映射 之 后 ， 内 核 允 许 用 户 程序 继续 运行 。 
Linux 应 用 程序 并 不 需要 操心 这 一 过 程 ， 因 为 所 有 的 有 具体 实现 都 已 隐藏 
在 内 核 中 了 。 

最 终 ， 当 应 用 程序 耗 尽 所 有 的 物理 内 存 和 交换 空间 ， 或 者 当 最 大 栈 
长 度 被 超过 时 ， 内 核 将 拒绝 此 后 的 内 存 请 求 ， 并 可 能 提前 终止 程序 的 运 
行 


这 种 “终止 进程 ”? 的 行为 和 早期 的 Linux 版 本 以 及 许多 其 他 版 本 
的 UNIX 系 统 有 所 不 同 ， 后 者 只 是 让 malloc 失 败 。 这 在 术语 上 被 称 
ASA FEES (OOM) 杀手 ”。 尺 管 这 看 上 去 好 像 非常 严厉 ， 但 实 
际 上 这 是 为 了 既 能 让 进程 快速 高 效 地 分 配 内 存 ， 又 能 让 Linux 内 核 
保护 目 己 免 受 资 源 耗 尽 的 破坏 〈 这 是 一 个 严重 的 问题 ) 而 做 的 一 
个 很 好 的 受 协 。 


那么 ， 这 一 切 对 于 应 用 程序 的 程序 员 来 说 意味 着 什么 呢 ? 简单 地 
说 ， 这 部 是 好 消 轧 。Linux 非 常 善于 管理 内 存 ， 它 允许 应 用 程序 使 用 数 


量 非常 巨大 的 内 存 ， 甚 全 使 用 一 个 单独 的 非常 大 的 内 存 块 。 但 你 必须 记 
住 的 是 ， 分 配 两 块 内 存 并 不 会 得 到 一 个 单独 的 可 以 连续 寻 址 的 内 存 块 。 
你 得 到 的 是 你 所 要 求 的 ， 两 个 独立 的 内 存 块 。 

那么 ， 这 种 明显 的 没有 限制 的 内 存 供应 和 在 内 存 耗 尽 前 系统 提前 终 
止 进程 的 做 法 是 否 意味 着 ， 对 malloc 函 数 的 返回 值 进行 检查 没有 意义 
Ne? 显然 不 是 。 在 使 用 动态 分 配 内 存 的 C 语 言 程 序 中 ， 一 个 最 音 见 的 问 
题 是 试图 在 一 个 已 分 配 的 内 存 块 之 后 写 数据 。 在 发 生 这 种 情况 时 ， 程 序 
可 能 并 不 会 并 即 终 止 ， 但 你 可 能 已 绑 盖 了 malloc 库 例 程 内 部 使 用 的 一 些 
数据 。 

通常 这 可 能 会 导致 后 续 的 malloc 调 用 失败 ， 但 这 并 不 是 因为 没有 足 
够 的 内 存 可 以 分 配 ， 而 是 因为 内 存 的 结构 已 经 被 破坏 。 人 退 踪 这 类 问题 非 
第 困难 ， 在 程序 里 越 早 检测 到 这 类 错误 ， 就 越 有 机 会 找到 其 原因 。 在 本 
书 的 第 10 章 介绍 调试 和 优化 的 时 候 ， 我 们 将 讨论 一 些 有 助 于 妃 躁 这 类 内 
存 问题 的 工具 。 


7.1.3 ”小 用 内 在 


假设 想 要 对 内 存 干 点 “坏事 ”"。 在 下 面 这 个 程序 memory4.c 中 ， 先 分 
配 一 些 内 存 ， 然 后 尝试 在 它 之 后 写 些 数据 。 


x 验 滥用 内 存 
#include <stdlib.h> 


iefin NE 


程序 的 输出 很 简单 ， 如 下 所 示 : 


> /memory4 


实验 解析 


Linux 内 存 管 理 系统 能 保护 系统 的 其 他 部 分 免 受 这 种 内 存 滥用 的 影 
响 。 为 了 确保 一 个 行为 恶劣 的 程序 (如 本 例 ) 无 法 破 化 任何 其 他 程序 ， 
Linux 会 终止 其 运行 。 

每 个 在 Linux 系 统 中 运行 的 程序 都 只 能 看 到 属于 上 自己 的 内 存 映像 ， 
不 同 的 程序 看 到 的 内 存 映像 不 同 。 只 有 操作 系统 知道 物理 内 存 是 如 何 安 
7 ae 不 仅 为 用 户 程序 管理 内 存 ， 同 时 也 为 用 户 程 序 提 供 彼 此 之 间 的 
MAIRI o 


7.1.4 78 


与 MS-DOS 不 同 ， 现 代 的 Linux 系 统 更 像 新 版 本 的 Windows 系 统 ， 虽 
但 它 对 空 指针 指向 地 址 的 读 写 提供 了 很 
强 的 保护 。 


实 验 访问 空 指针 
我 们 通过 memory5a.c 程 序 来 看 看 访问 空 指 针 时 会 发 生 的 情况 : 


inistd.h> 
dlib.h> 


其 输出 为 : 


. ‘memorySa 


实验 解析 

第 一 个 printf 函 数 试图 打印 一 个 取 自 衬 指 针 的 字符 串 ， 接 着 sprintf 函 
数 党 试问 一 个 空 指 针 里 写 数据 。 在 本 例 中 ，Linux〈 在 GNU “C 函 数 库 的 
包装 下 ) 容 妨 了 读 操作 ， 它 只 输出 一 个 包含 uD 入 0 的 “魔术 ?字符 
串 。 但 对 于 写 操作 就 没有 如 此 宽容 了 ， 它 直接 终止 了 该 程序 。 这 在 有 些 
时 候 能 够 帮助 我 们 追踪 程序 中 的 漏洞 。 

如 果 再 试 一 次 ， 但 这 次 不 使 用 GNUC 函 数 库 ， 你 将 发 现 从 零 地 址 处 
读数 据 也 是 不 允许 的 。 请 看 下 面 的 memory5b.c 程 序 : 


其 输出 为 : 


memory5b 


这 次 ， 你 尝试 直接 从 零 地 址 处 读 取 数 据 ， 而 且 这 次 在 你 和 内 核 之 间 
并 没有 GNU 的 libc 库 存在 ， 于 是 ， 程 序 被 终止 了 。 要 注意 的 是 ， 有 些 版 
本 的 UNIX 系 统 允 许 从 零 地 址 处 读 取 数据 ， 但 Linux 不 允许 。 


7.1.5 释放 内 存 


到 目前 为 止 ， 我 们 只 是 分 配 内 存 ， 然 后 希望 当 程序 结束 时 ， 我 们 使 
用 的 内 存 不 会 丢失 。 幸 运 的 是 ，Linux 内 存 管理 系统 完全 有 能 力 保证 在 
程序 结束 时 ， 把 分 配给 它 的 内 存 返 回 给 系统 。 但 是 ， 大 多 数 程序 需要 的 
并 不 仅仅 是 分 配 一 些 内 存 ， 使 用 一 小 段 时 间 ， 然 后 就 退出 。 一 种 更 常见 
的 用 法 是 根据 需要 动态 地 使 用 内 存 。 

动态 使 用 内 存 的 程序 应 该 总 是 通过 free 调 用 ， 来 把 不 用 的 内 存 释放 
给 malloc 内 存 管 理 器 。 这 样 做 可 以 将 分 散 的 内 存 块 重新 合并 到 一 起 ， 并 
由 malloc 函 数 库 而 不 是 应 用 程序 来 管理 它 。 如 果 一 个 运行 中 的 程序 〈 进 
FE) 自己 使 用 并 释放 内 存 ， 则 这 些 自由 内 存 实际 上 仍然 处 于 被 分 配给 该 
进程 的 状态 。 在 幕后 ，Linux 将 程序 员 使 用 的 内 存 块 作 为 一 个 物理 页 面 
集 来 管理 ， 通 种 闪存 中 的 每 个 页 面 为 4K 字 节 。 但 如 果 一 个 凡 存 页 面 未 
被 使 用 ，Linux 内 存 管 理 器 就 可 以 将 其 从 物理 内 存 置换 到 交换 空间 中 
(术语 叫 换 页 ) ， 从 而 减轻 它 对 资源 使 用 的 影响 。 如 采 程 序 试图 访问 位 
于 已 置换 到 交换 空间 中 的 内 存 页 中 的 数据 ， 那 么 Linux 会 短暂 地 暂停 程 
序 ， 将 内 存 页 从 交换 空间 再 次 置换 到 物理 内 存 ， 然 后 允许 程序 继续 运 
行 ， 就 像 数 据 一 直 存 在 于 内 存 中 一 样 。 


#include <stdlib.h> 


void free(void *ptr_to memory); 


调用 free 时 使 用 的 指针 参数 必须 是 指向 由 malloc、calloc 或 realloc 调 
用 所 分 配 的 内 存 。 你 很 快 就 将 看 到 calloc 和 realloc 消 数 。 


K 验 释放 内 存 
下 面 这 个 程序 被 命名 为 memory6.c: 


char *some_memory 


输出 结果 是 : 


$ memory 


实验 解析 
这 个 程序 显示 了 如 何 调用 free 来 释放 内 存 ，free 函 数 带 有 一 个 指向 先 
前 分 配 内 存 的 指针 参数 。 


请 记 住 : 一 旦 调用 free 释 放 了 一 块 内 存 ， 它 就 不 再 属于 这 个 进 
程 。 它 将 由 malloc 函 数 库 负责 管理 。 在 对 一 块 内 存 调用 free 之 后 ， 
就 绝 不 能 再 对 其 进行 读 写 操作 了 。 


7.1.6 ”其 他 内 存 分 配 函 数 


另外 两 个 内 存 分 配 函 数 并 不 像 malloc 和 free 使 用 的 那样 频繁 ， 它 们 
是 calloc 和 realloc， 其 原型 为 : 


void *calloc(size_t number_of_elements, size_t element_size); 
void *realloc(void *existing_ memory, size_t new_size); 


虽然 calloc 分 配 的 内 存 也 可 以 用 free 来 释放 ， 但 它 的 参数 与 mnalloc 有 
所 不 同 。 它 的 作用 是 为 一 个 结构 数组 分 配 内 存 ， 因 此 需要 把 元 素 个 数 和 
每 个 元 素 的 大 小 作为 其 参数 。 它 所 分 配 的 内 存 将 全 部 初始 化 为 0。 如 果 
calloc 调 用 成 功 ， 将 返回 指 问 数 组 中 第 一 个 元 素 的 指针 。 与 malloc 调 用 类 
似 ， 后 续 的 calloc 调 用 无 法 保证 能 返回 一 个 连续 的 内 存 空 间 ， 因 此 不 能 


通过 重复 调用 calloc， 并 期 望 第 二 个 调用 返回 的 内 存 正 好 接 在 第 一 个 调 
用 返回 的 内 存 之 后 来 扩大 calloc 调 用 创建 的 数组 。 

realloc 函 数 用 来 改变 先前 已 经 分 配 的 内 存 块 的 长 度 。 它 需要 传递 一 
个 指向 先前 通过 malloc、calloc 或 realloc 调 用 分 配 的 内 存 的 指针 ， 然 后 根 
据 new_size 参 数 的 值 来 增加 或 减少 其 长 度 。 为 了 完成 这 一 任务 ，realloc 
函数 可 能 不 得 不 移动 数据 ， 因 此 特别 重要 的 一 点 是 ， 你 要 确保 一 旦 内 存 
被 重新 分 配 之 后 ， 你 必须 使 用 新 的 指针 而 不 是 使 用 realloc 调 用 前 的 那个 
指针 去 访问 内 存 。 

另外 一 个 需要 注意 的 问题 是 ， 如 果 realloc 无 法 调整 内 存 块 大 小 的 
话 ， 它 会 返回 一 个 null 指 针 。 这 束 意 味 着 在 一 些 应 用 程序 中 ， 你 必须 吉 
免 使 用 类 似 下 面 这 样 的 代码 : 


如 果 realloc 调 用 失败 ， 它 将 返回 一 个 空 指针 ，my_ptr 就 将 指 同 null， 
而 先前 用 malloc 分 配 的 内 存 将 无 法 再 通过 my_ptr 进 行 访问 。 因 此 ， 在 释 
放 老 内 存 块 之 前 ， 最 好 的 方法 是 先 用 malloc 请 求 一 块 新 内 存 ， 再 通过 
memcpy 调 用 把 数据 从 老 内 存 块 复制 到 新 的 内 存 块 。 这 样 即使 出 现 错 
误 ， 应 用 程序 还 是 可 以 继续 访问 存储 在 原来 内 存 块 中 的 数据 ， 从 而 能 够 
实现 一 个 干净 的 程序 终止 。 


ri RE 


文件 锁定 是 多 用 户 、 多 任务 操作 系统 中 一 个 非常 重要 的 组 成 部 分 。 
程序 经 第 需要 共 至 数据 ， 而 这 通常 是 通过 文件 来 实现 的 。 因 此 ， 对 于 这 
些 程序 来 说 ， 建 并 茶 种 控制 文件 的 方式 束 非 常 重要 了 。 只 有 这 样 ， 文 件 
才 可 以 通过 一 种 安全 的 方式 更 新 ， 或 者 说 ， 当 一 个 程序 正在 对 文件 进行 
写 操作 时 ， 文 件 就 会 进入 一 个 暂时 状态 ， 在 这 个 状态 下 ， 如 果 男 外 一 个 
REP SDK TS MPF, ERS AE PORE EIR RAS AR 

Linux 提 供 了 多 种 特性 来 实现 文件 锁定 。 其 中 最 简单 的 方法 就 是 以 
原子 操作 的 方式 创建 锁 文 件 ， 所 谓 “ 原 子 操作 ?就 是 在 创建 锁 文 件 时 ， 系 
统 将 不 允许 任何 其 他 的 事情 发 生 。 这 就 给 程序 提供 了 一 种 方式 来 确保 它 
E EE A AE E 
建 


第 二 种 方法 更 高 级 一 些 ， 它 允许 程序 锁定 文件 的 一 部 分 ， 从 而 可 以 
独 至 对 这 一 部 分 内 容 的 访问 。 有 两 种 不 同 的 方式 可 以 实现 第 二 种 形式 的 
文件 锁定 。 我 们 将 只 对 其 中 的 一 种 做 详细 介绍 ， 因 为 两 种 方式 非常 相似 
一 一 第 二 种 方式 只 不 过 是 程序 接口 稍微 不 同 而 已 。 


7.2.1 创建 锁 文 件 


许多 应 用 程序 只 需要 能 够 针对 某 个 资源 创建 一 个 锁 文 件 即 可 。 然 
后 ， 其 他 程序 就 可 以 通过 检查 这 个 文件 来 判断 它们 自己 是 否 被 允许 访问 
这 个 资源 。 

这 些 锁 文 件 通 党 都 被 放置 在 一 个 特定 位 置 ， 并 市 有 一 个 与 被 控制 资 
源 相关 的 文件 名 。 例 如 ， 当 一 个 调制 解 调 器 正在 被 使 用 时 ，Linux 通 党 
会 在 /var/spool 目 录 下 创建 一 个 锁 文件 。 

注意 ， 锁 文件 仅仅 只 是 充当 一 个 指示 器 的 角色 ， 程 序 间 需 要 通过 相 
互 协作 来 使 用 它们 。 用 术语 来 说 ， 锁 文件 只 是 建议 锁 ， 而 不 是 强制 锁 ， 
在 后 者 中 ， 系 统 将 强制 锁 的 行为 。 

为 了 创建 一 个 用 作 锁 指示 器 的 文件 ， 你 可 以 使 用 在 fcnt1.h 尖 文件 
(你 在 前 面 的 章节 中 见 过 这 个 文件 ) 中 定义 的 open 系 统 调 用 ， 并 带 上 
O_CREAT 和 O_EXCL 标 志 。 这 样 能 够 以 一 个 原子 操作 同时 完成 两 项 工 
YE: 确定 文件 不 存在 ， 然 后 创建 它 。 


K 验 创建 锁 文件 
你 可 以 在 下 面 的 程序 lock1.c 中 看 到 锁 文件 是 如 何 创 建 的 : 


第 一 次 运行 这 个 程序 时 ， 它 的 输出 是 : 


lock1 


但 当 你 再 次 运行 这 个 程序 时 ， 它 的 输出 是 : 


lockl 


实验 解析 

这 个 程序 调用 带 有 O_CREAT 和 O_EXCL 标 志 的 open 来 创建 文 
件 /tmp/LCK.test。 第 一 次 运行 程序 时 ， 由 于 文件 并 不 存在 ， 所 以 open 调 
用 成 功 。 但 对 程序 的 后 续 调用 失败 了 ， 因 为 文件 已 经 存在 了 。 如 果 想 让 
程序 再 次 执行 成 功 ， 你 必须 删除 那个 锁 文件 。 

至 少 在 Linux 系 统 中 ， 错 误 号 17 代 表 的 是 EEXIST， 这 个 错误 用 来 表 
示 一 个 文件 已 存在 。 错 误 号 定义 在 头 文件 errno.h 或 〈 更 常见 的 ) 它 所 包 
含 的 头 文 件 中 。 在 本 例 中 ， 这 个 错误 号 实际 定义 在 头 文 


件 /usr/include/asm-generic/errno-base.h 中 : 


这 是 一 个 适合 于 表示 open (O_CREAT | O_EXCL) 失败 的 错误 号 。 

如 果 一 个 程序 在 它 执行 时 ， 只 需 独 占 某 个 资源 一 段 很 短 的 时 间 一 一 
这 用 术语 来 说 ， 通 常 被 称 为 临界 区 ， 它 就 需要 在 进入 临界 区 之 前 使 用 
open 系 统 调用 创建 锁 文 件 ， 然 后 在 退出 临界 区 时 用 unlink 系 统 调用 删除 
该 锁 文 件 。 

你 可 以 通过 编写 一 个 示例 程序 并 同时 运行 它 的 两 份 副本 ， 来 演示 程 
序 是 如 何 利用 这 个 锁 机 制 来 协调 工作 的 。 你 将 用 到 在 第 4 章 中 见 过 的 
getpid 调 用 ， 它 返回 进程 标识 符 : 一 个 对 于 每 个 当前 运行 的 程序 都 唯一 
的 数字 编号 。 


实 验 协调 性 锁 文 件 
C1) 下 面 是 测试 程序 lock2.c 的 源 代码 : 


n 
$ sde 
ti 14 
$3 ude 
$i ude 
h i K.test 
jes 3 Ñ EX 
ile 
PrantE( 9G Lock already present\n", getpid()); 
sleep (3 
else I 
外界 区 从 这 里 开始 
(2) 临界 区 从 这 里 开始 : 
printt("td - I have exclusive access\n*, getpid()); 


(3) 在 这 里 结束 : 


fs 在 运行 这 个 程序 之 前 ， 你 应 该 先 用 下 面 的 命令 来 确保 锁 文件 不 存 
Hs 


$ rm -f /tmp/LCK.test2 
然后 用 下 面 这 个 命令 来 运行 这 个 程序 的 两 份 副 本 : 
$ ./lock2 & ./lock2 


这 个 命令 在 后 台 运 行 lock2 的 一 份 副本 ， 在 前 台 运 行 男 一 份 副 本 。 
下 面 是 它 的 输出 结果 : 


上 面 的 例子 显示 了 同一 个 程序 的 两 个 实例 是 如 何 协调 工作 的 。 当 运 
行 这 个 例子 的 时 候 ， 你 几乎 肯定 会 看 到 与 上 述 输 出 不 同 的 进程 标识 符 ， 
但 程序 的 行为 将 是 一 样 的 。 

实验 解析 

出 于 演示 目的 ， 你 使 用 while 语 名 让 程序 循环 10 次 。 这 个 程序 然后 
通过 创建 一 个 唯一 的 锁 文件 /tmp/LCK.test2 来 访问 临界 资源 。 如 果 因 为 
文件 已 存在 而 失败 ， 程 序 将 等 候 一 小 段 时 间 后 再 次 尝试 。 如 果 成 功 ， 它 
就 可 以 开始 访问 资源 。 在 标记 为 “临界 区 ”的 部 分 ， 你 可 以 执行 任何 需要 
独占 式 访问 的 处 理 。 

因为 这 只 是 一 个 演示 程序 ， 所 以 你 只 等 待 了 一 小 段 时 间 。 程 序 使 用 
完 资源 后 ， 它 将 通过 删除 锁 文 件 来 释放 锁 。 然 后 它 可 以 在 重新 申请 锁 之 
前 执行 一 些 其 他 的 处 理 〈 本 例 中 只 是 调用 sleep 函 数 ) 。 这 里 锁 文 件 扮 演 
了 类 似 二 进 制 信号 量 的 角色 ， 就 问题 “我 可 以 使 用 这 个 资源 吗 ? ”给 每 个 
程序 一 个 “是 ?或 “ 否 ” 的 答案 。 你 将 在 第 14 章 进一步 学 习 信 和 号 量 。 


这 是 一 个 进程 间 协 调 性 的 安排 ， 你 必须 正确 地 编写 代码 以 使 
其 正 党 工作， 意识 到 这 一 点 是 非常 重要 的 。 当 程序 创建 锁 文 件 失 
败 时 ， 它 不 能 通过 删除 文件 并 重新 尝试 的 方法 来 解决 此 问题 。 或 
许 这 样 做 可 以 让 它 创 建 锁 文件 ， 但 为 一 个 创建 锁 文 件 的 程序 将 无 
法 得 知 它 已 经 不 再 拥有 对 这 个 资源 的 独占 式 访问 权 了 。 


7.2.2 KRAE 


用 创建 锁 文 件 的 方法 来 控制 对 诸如 串 行 口 或 不 经 常 访 问 的 文件 之 类 
的 资源 的 独占 式 访问 ， 是 一 个 不 错 的 选择 ， 但 它 并 不 适用 于 访问 大 型 的 


共享 文件 。 假 设 你 有 一 个 大 文件 ， 它 由 一 个 程序 写 入 数据 ， 但 却 由 许多 
不 同 的 程序 同时 对 这 个 文件 进行 更 新 。 当 一 个 程序 负责 记录 长 期 以 来 连 
续 收 集 到 的 数据 ， 而 其 他 一 些 程序 负责 对 记录 的 数据 进行 处 理 时 ， 这 种 
情况 就 可 能 发 生 。 处 理 程序 不 能 等 待 记 录 程 序 结束 ， 因 为 记录 程序 将 一 
直 不 停 地 运行 ， 所 以 它们 需要 一 些 协调 方法 来 提供 对 同一 个 文件 的 并 发 
访问 。 

你 可 以 通过 锁定 文件 区 域 的 方法 来 解决 这 个 问题 ， 文 件 中 的 某 个 特 
定 部 分 被 锁定 了 ， 但 其 他 程序 可 以 访问 这 个 文件 中 的 其 他 部 分 。 这 被 称 
为 文件 段 锁定 或 文件 区 域 锁 定 。Linux 提 供 了 至 少 两 种 方式 来 实现 这 一 
功能 : 使 用 fcnt1 系 统 调用 和 使 用 lockf 调 用 。 我 们 将 主要 介绍 fcnt1 接 口 ， 
因为 它 是 最 常 使 用 的 接口 。lockf 和 fent1 非 常 相似 ， 在 Linux 中 ， 它 一 般 
作为 fcnt1 的 备 选 接口 。 但 是 ，fcnt1 和 1]ockf 的 锁定 机 制 不 能 同时 工作 : 它 
们 使 用 不 同 的 底层 实现 ， 因 此 决 不 要 混合 使 用 这 两 种 类 型 的 调用 ， 而 应 
坚持 使 用 其 中 的 一 种 。 

你 已 在 第 3 章 中 见 过 fcnt1 调 用 ， 它 的 定义 如 下 所 示 : 


#include <fentl.h> 


fcnt1 对 一 个 打开 的 文件 描述 符 进 行 操作 ， 并 能 根据 command 参 数 的 
设置 完成 不 同 的 任务 。 它 为 我 们 提供 了 3 个 用 于 文件 锁定 的 命令 选项 : 

O F_GETLK 

O F_SETLK 

O F_SETLKW 

当 使 用 这 些 命令 选项 时 ，fcnt1 的 第 三 个 参数 必须 是 一 个 指向 flock 结 
构 的 指针 ， 所 以 实际 的 函数 原型 应 为 : 


int fcntl(int fildes, int command, struct flock *flock structure); 
flock CFF) 结构 依赖 具体 的 实现 ， 但 它 至 少 包含 下 述 成 员 : 
short |_type 
short |_whence 
off_t |_start 
off tl len 
pid_t 1 pid 
1L_type 成 员 的 取 值 定义 在 头 文 件 fcnt1.h 中 ， 如 表 7-1 所 示 。 


表 7-1 
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l whence、1]_ start 和 1_ len 成 员 定 义 了 文件 中 的 一 个 区 域 ， 即 一 个 连 
续 的 字 节 集合 。1L_whence 的 取 值 必须 是 SEEK_SET、SEEK_CUR、 
SEEK_END《〈 在 头 文件 unistd.h 中 定义 ) 中 的 一 人 个。 它们 分 别 对 应 于 文 
件 头 、 当 前 位 置 和 文件 尾 。1_ whence 定 义 了 ]_start 的 相对 偏 移 值 ， 其 
HH, | start 是 该 区 域 的 第 一 个 字 节 。]_whence 通 常 被 设 为 SEEK_SET， 这 
时 ]_start 就 从 文件 的 开始 计算 。1 len 参 数 定义 了 该 区 域 的 字 节 数 。 

1_pid 参 数 用 来 记录 持 有 锁 的 进程 ， 参 见 下 面 对 F_GETLK 的 介绍 。 

文件 中 的 每 个 字 节 在 任 一 时 刻 只 能 拥有 一 种 类 型 的 锁 : 共享 锁 、 独 
占 锁 或 解锁 。fcnt1 调 用 可 用 的 命令 和 选项 的 组 合 相 当 多 ， 我 们 将 在 下 面 
依次 介绍 它们 。 


1. F_GETLK 命 令 


第 一 个 命令 是 F_GETLK。 它 用 于 获取 亿 des (第 一 个 参数 ) 打开 的 
文件 的 锁 信 息 。 它 不 会 尝试 去 锁定 文件 。 调 用 进程 把 自己 想 创建 的 锁 类 
型 信息 传递 给 fcnt1， 使 用 FE_GETLK 命 令 的 fcnt1 就 会 返回 将 会 阻止 获取 
锁 的 任何 信息 。 

flock 结 构 中 使 用 的 值 如 表 7-2 所 示 。 


表 7- 


i fai 说 E 


进程 可 能 使 用 F_GETLK 调 用 来 查看 文件 中 某 个 区 域 的 当前 锁 状 
态 。 它 应 该 设置 flock 结 构 来 表明 它 需 要 的 锁 类 型 ， 并 定义 它 感 兴趣 的 文 
件 区 域 。fcnt1 调 用 如 果 成 功 就 返回 非 -1 的 值 。 如 果 文 件 已 被 锁定 从 而 阻 
止 锁 请 求 成 功 执行 ，fcnt1 会 用 相关 信息 履 盖 flock 结 构 。 如 果 锁 请 求 可 以 
成 功 执行 ，flock 结 构 将 保持 不 变 。 如 果 F_GETLK 调 用 无 法 获得 信息 ， 
它 将 返回 -1 表明 失败 。 

如 果 F_GETLK 调 用 成 功 〈 例 如 ， 它 返回 一 个 非 -1 的 值 ) ， 调 用 程序 


就 必须 检查 flock 结 构 的 内 容 来 判断 其 是 否 被 修改 过 。 因 为 ]_pid 的 值 被 设 
置 成 持 有 锁 的 进程 〈 如 果 有 的 话 ) 的 标识 符 ， 所 以 通过 检查 这 个 字段 就 
可 以 很 方便 地 判断 出 flock 结 构 是 否 被 修改 过 。 

2. FE_SETLK 命 令 


这 个 命令 试图 对 fildes 指 同 的 文件 的 某 个 区 域 加 锁 或 解锁 。flock 结 
构 中 使 用 的 值 〈 与 FE_GETLK 命 令 中 用 到 的 不 同 之 处 ) 如 表 7-3 所 示 。 


表 7-3 


{fa 


nE Spee a E, ， we 独占 或 号 镇 则 取 什 为 WRLCK， 
Aa | wt x 


与 F_GETLK 一 样 ， 要 加 锁 的 区 域 由 flock 结 构 中 的 ]_start、1]_whence 
和 ]_len 的 值 定义 。 如 果 加 锁 成 功 ，fcnt1 将 返回 一 个 非 -1 的 值 ， 如 果 失 
败 ， 则 返回 -1。 这 个 函数 总 是 立刻 返回 。 


3. FE_SETLKW 命 令 

F_SETLKW 命 令 与 上 面 介 绍 的 FE_SETLK 命 令 作 用 相同 ， 但 在 无 法 
获取 锁 时 ， 这 个 调用 将 等 待 直到 可 以 为 止 。 一 旦 这 个 调用 开始 等 待 ， 只 
有 在 可 以 获取 锁 或 收 到 一 个 信号 时 它 才 会 返回 。 我 们 将 在 第 11 章 讨论 信 


J o 
程序 对 茶 个 文件 拥有 的 所 有 锁 都 将 在 相应 的 文件 描述 符 被 关闭 时 有 目 
动 清除 。 在 程序 结束 时 也 会 自动 清除 各 种 锁 。 


当 对 文件 区 域 加 锁 之 后 ， 你 必须 使 用 底层 的 reaad 和 write 调用 来 访问 
文件 中 的 数据 ， 而 不 要 使 用 更 高 级 的 fread 和 fwrite 调 用 ， 这 是 因为 fread 
和 fwrite 会 对 读 写 的 数据 进行 缓存 ， 所 以 执行 一 次 fread 调 用 来 读 取 文件 
中 的 头 100 个 字 节 可 能 〈 事 实 上 ， 是 几乎 肯定 如 此 ) 会 读 取 超过 100 个 字 
节 的 数据 ， 并 将 多 余 的 数据 在 函数 库 中 进行 缓存 。 如 果 程 序 再 次 使 用 
fread 来 读 取 下 100 个 字 节 的 数据 ， 它 实际 上 将 读 取 已 缓冲 在 函数 库 中 的 
数据 ， 而 不 会 引发 一 个 底层 的 read 调 用 来 从 文件 中 取出 更 多 的 数据 。 

为 了 说 明 这 为 什么 是 一 个 问题 ， 让 我 们 来 考虑 这 样 一 个 例子 : 两 个 
程序 都 打算 更 新 同一 个 文件 。 假 设 这 个 文件 由 200 个 全 为 零 的 字 市 组 


成 。 第 一 个 程序 先 开 始 运 行 ， 并 获得 该 文件 头 100 个 字 节 的 写 锁 。 它 然 
后 使 用 fread 来 读 取 这 100 个 字 节 。 但 是 正如 我 们 在 前 面 章节 中 所 看 到 
的 ，fread 会 一 次 读 取 多 达 BUFSIZ 个 字 节 的 数据 ， 因 此 ， 它 实际 上 把 整 
个 文件 都 读 到 了 内 存 中 ， 但 仅 把 头 100 个 字 节 传递 给 程序 。 

接着 ， 第 二 个 程序 开始 运行 。 它 获得 了 文件 后 100 个 字 节 的 写 锁 。 
这 个 操作 将 会 成 功 ， 因 为 第 一 个 程序 只 锁定 了 文件 的 前 100 个 字 节 。 第 
二 个 程序 将 100~199 字 节 的 数据 都 写成 2， 关 闭 文 件 并 解锁 ， 最 后 退出 程 
序 。 n 第 一 个 程序 锁定 了 文件 的 后 100 个 字 节 ， 然 后 调用 fread 来 读 
取 数 据 。 尺 管 真正 存在 于 文件 中 的 数据 是 100 个 字 节 的 2， 但 是 因为 先前 
数据 已 经 被 缓存 ， 所 以 程序 实际 上 污 到 的 数据 将 是 100 个 字 节 的 堆 ， 但 
如 果 你 使 用 read 和 write， 这 个 问题 就 不 会 发 生 。 

上 述 关 于 文件 锁 的 描述 看 起 来 似乎 很 复杂 ， 但 实际 上 是 说 起 来 难 ， 
做 起 来 反而 要 容易 一 些 。 


K 验 使 用 fcnt1 锁 定 文件 

下 面 ， 我 们 通过 示例 程序 lock3.c 来 看 文件 锁定 是 如 何 工作 的 。 为 了 
试验 锁定 ， 你 需要 两 个 程序 : 一 个 用 来 锁定 而 另外 一 个 进行 测试 。 第 一 
个 程序 完成 锁定 。 

C1) 程序 从 包含 头 文件 和 变量 声明 开始 : 


25 条 开 一 修文 作者 壕 得 


(3) 给 文件 添加 一 些 数据 : 


(4) 把 文件 的 10~30 字 节 设 为 区 域 1， 并 在 其 上 设置 共享 锁 : 


(5) 把 文件 的 40~50 字 节 设 为 区 域 >2， 并 在 其 上 设置 独占 锁 : 


yn 2,1_wher SEEK_SET; 
region_2.l start = 40; 
region_2.lien = 10 


(6) 现在 锁定 文件 : 


(7) 然后 等 一 会 儿 : 


实验 解析 

程序 首先 创建 一 个 文件 ， 并 以 可 读 可 写 方式 打开 它 ， 然 后 再 在 文件 
中 添加 一 些 数据 。 接 着 在 文件 中 设置 两 个 区 域 ， 第 一 个 区 域 为 10~30 字 
节 ， 使 用 共享 OZ) 锁 ; 第 二 个 区 域 为 40~~50 字 节 ， 使 用 独占 ( 写 ) 
i E erenees 
等 待 一 分 钟 。 


图 7-1 显 示 了 当 程 序 开 始 等 待 时 文件 锁定 的 状态 。 


这 个 程序 本 里 并 不 是 非常 有 用 。 你 需要 用 第 二 个 程序 lock4.c 来 测试 


锁 。 


实 验 测试 文件 上 的 锁 

在 本 例 中 ， 你 将 编写 一 个 程序 来 测试 可 能 会 用 在 文件 不 同 区 域 上 的 
各 种 类 型 的 锁 。 

(1) 与 往常 一 样 ， 程 序 从 包含 头 文件 和 声明 变量 开始 : 


#include <unistd.h 
finclude tdlib.h 
incl ude tdio 

# ude it 


const char *cest_fiie = “/tmp/test_lock"; 
§define SIZE_TO_TRY 5 


void show_lock_info(struct flock *to_show); 


int main! 
{ 
int file_desc; 
int res; 
struct flock region_to_test; 
int start byte; 


(2) FTP CFF FIR 


file_desc = open(test_file, O_RDWR | O_CREAT, 0666); 

if (!file desc) { 
fprintf(stderr, "Unable to open ts for read/write’, test_file); 
exit (EXIT_FAILURE) ; 

} 


for (start_byte = 0; start byte < 99; start_byte += SIZE_TO_TRY) { 


(3) 设置 希望 测试 的 文件 区 域 : 


region to test.l_ type = F_WRLCK; 
region_to_test.1l whence = SEEK_SET; 
region_to_test.l_start = start_byte; 
region_to_test.l_len = SIZE_TO_TRY; 
region _to_test.l_pid = -1; 


printf(*Testing F_WRLCK on region from $d to %d\n", 
start_byte, start_byte + SIZE_TO_TRY); 


(4) 现在 测试 文件 上 的 锁 : 


res = fontl(file desc, F_GETLK, &region_to_test); 
if (res == -1) { 
fprintfistderr, *F_GETLK failed\n*"); 
exit (EXIT_FAILURE) ; 
} 
if (region_to_test.l pid te -1) ( 
princtf(*Lock would fail. F_GETLK returned: \n"}; 
show_lock_info (kregion_to_test); 


} 
else { 


printf (*F_WRLCK - Lock would succeed\n"); 


} 
(5) 用 共享 〈 读 ) 锁 重 复 测试 一 次 ， 再 次 设置 希望 测试 的 文件 区 


region_to_test.1_ type = F_RDLCK; 

region_to_test.1l_whence = SEEK_SET; 

region_to_test.l_start = start_byte; 

region_to_test.i_len = SIZE_TO_TRY; 

regicon_to_test.l_pié = -1; 

printf (*Testing F_RDLCK on region from td to td\n", 
start_byte, start_byte + SIZE_TO_TRY); 


C6) 再 次 测试 文件 上 的 锁 : 


r ntlifile F kr _ to, 
it == } {f 
printf (stder ETL aile 
x Ex FAILURE 
egion_to_ l_pi 
rin L uld ETLI 
= reg to_test 
ei 
i -RDO m3 3 
id s? fo k-s ow) 
pr type sho ri_type) ; 
pr whence % how->i whence 
pri _sta t show->1 
ri len | A int) to_show->l_len); 
printf("l pid %d\n*, to show->i_pid); 


为 了 测试 锁 ， 需 要 首先 运行 程序 lock3， 然 后 再 运行 程序 lock4 来 测 
试 锁 。 你 可 以 通过 在 后 台 运 行程 序 lock3 来 达到 这 个 目的 ， 下 面 是 执行 
的 命令 : 


- lock3 & 


命令 提示 符 又 出 现 了 ， 这 是 因为 lock3 是 在 后 台 运 行 的 ， 紧 接着 你 
用 下 面 的 命令 来 运行 程序 lock4: 


lock4 


下 面 是 得 到 的 输出 ， 为 简洁 起 见 ， 输 出 内 容 做 了 一 些 省 略 : 


实验 解析 

lock4 程 序 把 文件 中 的 每 5 个 字 节 分 成 一 组 ， 为 每 个 组 设置 一 个 区 域 
结构 来 测试 锁 ， 然 后 通过 使 用 这 些 结构 来 判断 对 应 区 域 是 否 可 以 被 加 写 
锁 或 读 锁 。 返 回信 息 将 显示 造成 锁 请 求 失败 的 区 域 字 节 数 和 从 字 节 0 开 
始 的 偏 移 量 。 因 为 返回 结构 中 的 ]_pid 元 素 包 含 当前 拥有 文件 锁 的 程序 的 
进程 标识 符 ， 所 以 程序 先 把 它 设置 为 -1〈 一 个 无 效 值 ) ， 然 后 在 fcnt1 调 
用 返回 后 检测 其 值 是 否 被 修改 过 。 如 果 该 区 域 当前 未 被 锁定 ，]L_pid 的 值 
就 不 会 被 改变 。 

为 了 理解 程序 输出 的 含义 ， 你 需要 得 看 程序 中 包含 的 头 文件 fcnt1.h 
(通常 是 /usr/include/fcnt1.h〉， 1Ltype 的 值 为 1 对 应 的 定义 为 FE_WRLCK， 
]_type 的 值 为 0 对 应 的 定义 为 F_RDLCK。 因 此 ，]_type 的 值 为 1 表明 锁 失 
败 的 原因 是 已 经 存在 一 个 写 锁 了 ， 而 L_type 的 值 为 0 是 因为 已 经 存在 一 个 
该 锁 了 。 在 文件 中 未 被 lock3 程 序 锁定 的 区 域 上 ， 无 论 是 共享 锁 还 是 独 
占 锁 都 将 会 成 功 。 

你 可 以 看 到 10~30 字 节 上 可 以 设置 一 个 共享 锁 ， 因 为 程序 lock3 在 该 
区 域 上 设置 的 是 共享 锁 而 不 是 独占 锁 。 而 在 40~50 字 节 的 区 域 上 ， 两 种 
锁 都 将 失败 ， 因 为 lock3 已 经 在 该 区 域 上 设置 了 一 个 独占 〈F_WRLCK) 
锁 。 

当 程 序 lock4 执 行 结束 后 ， 你 需要 等 竺 一 小 段 时 间 让 程序 lock3 完 成 
它 的 sleep 调 用 并 退出 。 


7.2.4 文件 锁 的 竞 


现在 你 已 知道 如 何 测试 一 个 文件 上 的 已 有 锁 ， 下 面 让 我 们 来 看 看 当 
两 个 程序 争夺 文件 同一 区 域 上 的 锁 时 会 发 生 什么 情况 。 你 将 再 次 用 
lock3 程 序 来 锁定 文件 ， 然 后 用 一 个 新 的 程序 lock5 来 尝试 对 它 进行 加 
ee a eee 0 
I 调用 。 


K 验 CPE SES 

下 面 的 程序 lock5.c 的 作用 不 再 是 测试 文件 中 不 同 部 分 的 锁 状 态 ， 而 
是 试图 对 文件 中 已 经 被 锁定 的 区 域 再 次 加 锁 。 
(1) 在 ##include 语 句 和 变量 声明 之 后 ， 打 开 一 个 文件 描述 符 : 


clude <stdiib.h> 


=... 
phe p be p 


nclude <fcntl.h> 


t main 


r, “Unable to open ts for read/write\n", test_file); 
EXIT_FAILURE) ; 


(2) 程序 的 其 余部 分 指定 文件 的 不 同 区 域 ， 并 尝试 在 它们 之 上 执 
行 不 同 的 锁定 操作 : 


regi iT “RDLCK; 
regior SEEK_SET; 
regior ; 
regiocr 
printft("Process td, trying F_RD td to td\n gJ 
n l a egion_to_ k.1_ sta 
on_to_l 
res = f TL regi k 
£ ires 
printé a 1 egion\n g d 
) else { 
f t d getp ) 
) 
regic ip UNLCK 
regio: SEE! T 
region to. Gs 10; 
region_to_ 于 
print f trying F_UNLCK d d ge 
t region_co_ -3ta 
region 
fer f egic 


res = fontlifile_desc, F_SETLK, sregion_to_lock); 
if (res =» -1) { 
printf{(*Process td - failed to unlock region\n*, getpid()); 
) else ( 
printf {*Process $d - unlocked region\n". getpidi)); 
} 


region_to_lock.l type = F_UNLCK; 
region_to_lock.l whence = SEEK_SET; 
region.to_lock.lstart = 0; 
region to_lock.l_len = 50; 
print{(*Process td, trying F_LUNLCK, region bd to bdin’, getpid(), 
{int) region_to_lock.l start, 
(int) (region_to_lock.i_start « 
region_to_lock.1_len)); 
res = feonti(file_desc, P_SETLK, éregion_to_lock); 
if {res == -1) ( 
printf(*Process td - failed to unlock region\n", getpid()): 
} else ( 
printf(*Process Wa - unlocked regicn\n*, getpid()): 
) 


region_to_lock.l type = F_WRLCK; 
region to.lock.l whence = SEEK_SET; 
region to _lock.l start = 16; 
region_to_lock.l_len = $; 
printft(*Process td, trying FLWRICK, region bd to bå\n', getpid(), 
(int) region_to_lock.l start, 
(int) (region_to_lock.l_ start + 
region_to_lock.1_len))}; 
res = fcenti(file desc, F_SETLK. sregion_to_lock); 
if (rep mm -1) { 
printt(*Process td - failed to lock region\n*, getpid()); 
) elae ( 
printt(*Proceas td - obtained lock on region\n", getpid{)); 
) 


region_to_lock.i_type = P_ROLCK: 
region_to_lock.l whence = SEEK SET; 
region_to_lock.]_start = 40; 
region_to_lock.l_len = 10; 
print{(*Process Wd, trying F_RDLCK, region $d to td\n*. getpid(), 
(int) region_to_lock.i_start, 
(int) (region_to_lock.l_start + 
region_to_lock.l_len)); 
res + fontl(file_desc, F_SETLK, éregion_to_lock); 
if (res =» -1) { 
printf{(*Process td - failed to lock region\n*, getpid{)); 
} else | 
princf(*Process td - obtained lock on region\n’, getpid({)); 
) 


region_to_lock.l_type = PLWRLCK: 
region_to_lock.l_whence = SEEK SET; 


region_to_lock.lstart = 16; 
region_to_lock.1l_len = 5; 
printf("Process td, trying F_WRLCK with wait, region %d to %d\n", getpidi), 
{int) region_to_lock.1l_start, 
(int) (region_to_lock.l_start + 
region_to_lock.1_len)); 
res = fontlifile_desc, F_SETLKW, &region_to_lock); 
if (res == -1) { 
printf (*Process td - failed to lock region\n*, getpid()); 
else { 
printf("Process %d - obtained lock on region\n", getpid()}; 


} 
printf£(*Process td ending\n", getpid()); 


close (file_desc); 
exit (EXIT_SUCCESS) ; 


如 果 首 先 在 后 台 运 行 lock3 程 序 ， 然 后 立刻 运 这 个 新 程序 ; 


$ ./lock3 & 


你 得 到 的 输出 如 下 所 示 : 


实验 解析 

首先 ， 这 个 程序 尝试 用 共享 锁 来 锁定 文件 中 10~15 字 节 的 区 域 。 这 
块 区 域 已 被 一 个 共享 锁 锁定 ， 但 共享 锁 允 许 同时 使 用 ， 因 此 加 锁 成 功 。 

它 然 后 解除 它 自 己 对 这 块 区 域 的 共享 锁 ， 这 也 成 功 了 。 接 下 来 ， 这 
个 程序 试图 解除 这 个 文件 前 50 字 节 上 的 锁 ， 虽 然 它 实际 上 并 未 对 这 块 区 
域 进行 锁定 ， 但 这 也 成 功 了 ， 因 为 虽然 这 个 程序 并 未 对 这 个 区 域 加 锁 ， 
a ee ae een 

EF] EA 。 

这 个 程序 接 下 来 试图 用 一 把 独占 锁 来 锁定 文件 中 16~21 字 节 的 区 
域 。 由 于 这 块 区 域 上 已 经 有 了 一 个 共享 锁 ， 独 占 锁 无 法 创建 ， 所 以 这 个 
锁定 操作 失败 了 。 

然后 ， 程 序 又 尝试 用 一 把 共享 锁 来 锁定 文件 中 40~50 字 节 的 区 域 。 
由 于 这 个 区 域 上 已 有 了 一 把 独占 锁 ， 因 此 这 个 锁定 操作 也 失败 了 。 

最 后 ， 程 序 再 次 尝试 在 文件 中 16~21 字 节 的 区 域 上 获得 一 把 独占 
锁 ， 但 这 次 它 用 F_SETLKW 命 令 来 等 待 直到 它 可 以 获得 一 把 锁 为 止 。 于 
是 程序 的 输出 就 会 遇 到 一 个 很 长 的 停顿 ， 直 到 已 锁 住 这 块 区 域 的 lock3 
程序 因为 完成 sleep 调 用 、 关 闭 文件 而 释放 了 它 先 前 获得 的 所 有 锁 为 止 。 
lock5 程 序 继续 执行 ， 成 功 锁定 了 这 块 区 域 ， 最 后 它 也 退出 了 运行 。 


7.2.5 ”其 他 锁 命令 


还 有 另外 一 种 锁定 文件 的 方法 : lockf 函 数 。 它 也 通过 文件 描述 符 进 
行 操作 。 其 原型 为 : 


function 参 数 的 取 值 如 下 所 示 。 

O F_ULOCK: 解 锁 。 

O F_LOCK: 设 置 独占 锁 。 

O F_TLOCK: 测 试 并 设置 独占 锁 。 

O F_TEST: 测 试 其 他 进程 设置 的 锁 。 
网 size_to_lock 参 数 是 操作 的 字 节 数 ， 它 从 文件 的 当前 偏 移 值 开始 计 

lockf 有 一 个 比 fcnt1 函 数 更 简单 的 接口 ， 这 主要 是 因为 它 在 功能 性 和 
灵活 性 上 都 要 比 fcnt1 函 数 差 一 些 。 为 了 使 用 这 个 函数 ， 必 须 首 先 搜 寻 你 
想 锁定 的 区 域 的 起 始 位 置 ， 然 后 以 要 锁定 的 字 节 数 为 参数 来 调用 它 。 

与 文件 锁定 的 fcnt1 方 法 一 样 ，lockf 设 置 的 所 有 锁 都 是 建议 锁 ， 它 们 
并 不 会 真正 地 阻止 你 读 写 文件 中 的 数据 。 对 锁 的 检测 是 程序 的 责任 。 混 
合 使 用 fcnt1 锁 和 lockf 锁 的 效果 未 被 定义 ， 因 此 你 必须 决定 使 用 哪 种 类 型 
的 锁定 方法 并 坚持 用 下 去 。 


7.2.6 JESI 


在 讨论 锁定 时 如 果 未 提 到 和 死 锁 的 危险 ， 那 么 这 个 讨论 就 不 能 算是 完 
整 的 。 假 设 两 个 程序 想 要 更 新 同一 个 文件 。 它 们 需要 同时 更 新 文件 中 的 
字 节 1 和 字 节 2。 程 序 A 选 择 首先 更 新 字 节 2， 然 后 再 更 新 字 节 1。 程 序 B 
则 是 先 更 新 字 节 1， 然 后 才 是 字 节 2。 

两 个 程序 同时 启动 。 程 序 A 锁 定 字 节 2， 而 程序 B 锁 定 字 节 1。 人 然后 
程序 A 尝试 锁定 字 节 1， 但 因为 这 个 字 节 已 经 被 程序 B 锁 定 ， 所 以 程序 A 
将 在 那里 等 等。 接着 程序 B 尝 试 锁定 字 节 2， 但 因为 这 个 字 节 已 经 被 程序 
A 锁定 ， 所 以 程序 B 也 将 在 那里 等 待 。 

这 种 两 个 程序 都 无 法 继续 执行 下 去 的 情况 ， 就 被 称 为 死 锁 
(deadlock 或 deadly embrace〉。 这 个 问题 在 数据 库 应 用 程序 中 很 常见 ， 
当 许 多 用 户 频 繁 访问 同一 个 数据 时 就 很 容易 发 生死 锁 。 大 多 数 的 商业 关 
系 型 数据 库 都 能 够 检测 到 死 锁 并 自动 解 开 ， 但 Linux 内 核 不 行 。 这 时 就 
需要 采取 一 些 外 部 干涉 手段 ， 例 如 强制 终止 其 中 一 个 程序 来 解决 这 个 问 
题 。 

程序 员 必 须 对 这 种 情况 提高 警惕 。 当 有 多 个 程序 都 在 等 待 获得 锁 
时 ， 你 就 需要 非常 小 心地 考虑 是 否 会 发 生死 锁 。 在 本 例 中 ， 死 锁 是 非常 
容易 避免 的 ; 两 个 程序 只 需要 使 用 相同 的 顺序 来 锁定 它们 需要 的 字 节 或 
锁定 一 个 更 大 的 区 域 即 可 。 


在 这 里 ， 我 们 没有 足够 的 篇 幅 来 讲解 开发 并 发 程序 的 原理 。 如 
果 你 有 兴趣 了 解 更 多 ， 请 参阅 Principles of | Concurrent and 
Distributed Programming ”〈《 并 发 和 分 布 式 程序 设计 原理 》， 
M.Ben-Ari, Prentice Hall, 1990) 。 


7.3 2 


你 已 经 看 到 如 何 使 用 文件 来 储存 数据 ， 那 么 为 什么 还 要 用 数据 库 
Ne? 非常 简单 ， 因 为 在 有 些 情况 下 ， 数 据 库 的 特性 提供 了 解决 问题 的 更 
好 方 潜 。 与 使 用 文件 来 存储 数据 相 比 ， 使 用 数据 库 有 如 下 两 方面 的 优 


O 你 可 以 存储 长 度 可 变 的 数据 记录 ， 这 对 平面 的 、 非 结构 化 的 文 
件 来 说 实现 起 来 有 后 困 难 。 

O 数据 库 使 用 索引 来 有 效 地 存储 和 检索 数据 。 这 样 做 的 一 个 显著 
优点 是 这 个 索引 不 必 非 得 是 一 个 简单 的 记录 号 一 一 这 在 平面 文件 中 
很 容易 实现 ， 它 可 以 是 一 个 任意 的 字符 串 。 


7.3.1 dbm 数 据 库 


所 有 版 本 的 Linux 以 及 大 多 数 的 UNIX 版 本 都 随 系统 带 有 一 个 基本 
的 、 但 却 非 党 高效 的 数据 存储 例 程 集 ， 它 被 称 为 dbm 数 据 库 。dbm 数 据 
库 适合 于 存储 相对 比较 静态 的 索引 化 数据 。 一 些 数据 库 纯 粹 主义 者 可 能 
会 认为 dbm 根 本 算 不 上 是 一 个 数据 库 ， 充 其 量 束 是 一 个 索引 化 的 文件 存 
储 系统 。 但 X/Open 规范 把 dbm 看 作 古 一 个 数据 库 ， 因 此 在 本 书 里 我 们 也 


会 这 么 称呼 它 。 


1. dbm 简 介 


尽管 一 些 免 费 的 关系 型 数据 库 ， 如 MySQL 和 了 PostgreSQL 使 用 越 来 越 
广泛 ，dbm 数 据 库 仍然 在 Linux 中 扮演 着 一 个 重要 的 角色 。 那 些 使 用 
RPM 的 Linux 发 行 版 本 ， 如 RedHat 和 SUSE， 就 是 用 dbm 来 储存 已 安装 软 
件 包 的 信息 。LDAP 的 开源 实现 OpenLDAP 也 可 以 使 用 dbm 作 为 它 的 储存 
机 制 。 与 更 加 完整 的 数据 库 产 品 如 MySQL 相 比 ，dbm 的 优势 在 于 它 是 一 
个 很 轻 量 级 的 软件 ， 而 且 它 非常 容易 被 编译 进 一 个 可 发 布 的 三 进 制 文件 
中 ， 因 为 它 无 需 安装 独立 的 数据 库 服 务 器 。 在 写作 本 书 的 时 候 ， 
Sendmail 和 Apache 都 在 使 用 dbm 数 据 库 。 

dbm 数 据 库 可 以 使 用 索引 来 存储 可 变 长 的 数据 结构 ， 然 后 通过 索引 
或 顺序 扫描 数据 库 来 检索 结构 。dbm 数 据 库 适用 于 处 理 那 些 被 频繁 访问 
但 却 很 少 被 更 新 的 数据 ， 因 为 它 创建 数据 项 时 非常 慢 ， 而 检索 时 非常 


RK 
讲 到 这 里 ， 我 们 遇 到 了 一 个 小 问题 : 多 年 以 来 ，dbm 数 据 库存 在 着 


各 种 不 同 的 版 本 ， 它 们 的 API 接 口 和 特性 都 有 一 些 细微 的 差别 。 既 有 最 
初 的 dbm 集 ， 又 有 “新 ”的 被 称 为 ndbm 的 dbm 集 ， 还 有 GNU 的 dbm 实 现 
gdbm。GNU 的 实现 版 本 虽然 可 以 模拟 旧版 本 的 dbm 和 ndbm 接 口 ， 但 其 
本 身 的 接口 和 其 他 实现 版 本 相 比 ， 还 是 有 着 显著 的 不 同 。 不 同 的 Linux 
发 行 版 本 自 带 的 dbm 库 也 不 一 样 ， 虽 然 最 常见 的 选择 是 带 有 gdbm 库 ， 
为 它 可 以 模拟 其 他 两 种 接口 类 型 。 

在 这 里 ， 我 们 将 重点 介绍 ndbm 接 口 ， 因 为 它 已 由 X/Open 组 织 标准 
化 ， 并 且 它 的 使 用 要 比 原始 的 gdbm 实 现 简 单一 些 。 


2. 获得 dbm 


大 多 数 主 流 的 Linux 发 行 版 都 会 默认 安装 gdbm， 但 在 一 些 发 行 版 
中 ， 你 可 能 需要 使 用 软件 包 管 理 器 来 安装 相应 的 开发 库 。 例 如 ， 在 
Ubuntu 中 ， 你 可 能 需要 使 用 Synaptic 软 件 包 管理 器 来 安装 libgdbm-dev 软 
件 包 ， 因 为 它 一 般 不 会 被 默认 安装 。 

如 果 想 要 查看 gdbm 开 发 包 的 源 代码 ， 或 者 使 用 的 Linux 发 行 版 没有 
提供 预 编译 的 gdbm 开 发 包 ， 你 可 以 在 网 
址 www.gnu.org/software/gdbm/gdbm.html 上 找到 dbm 的 GNU 实 现 gdbm。 


3. 故障 解决 和 重 装 dbm 


本 章 假设 你 已 安装 了 dbm 的 GNU 实 现 gdbm 和 ndbm 兼 容 库 。Linux 发 
行 版 通常 都 已 这 么 做 了 ， 但 如 前 所 述 ， 你 可 能 必须 明确 安装 开发 库 软件 
包 以 编译 使 用 ndbm 例 程 的 文件 。 

遗憾 的 是 ， 对 于 不 同 的 Linux 发 行 版 ， 编 译 使 用 ndbm 库 的 源 文件 所 
需 的 包含 库 和 链接 库 略 有 不 同 ， 所 以 ， 虽 然 你 已 安装 了 gdbm 和 ndbm 兼 
容 库 ， 但 你 可 能 还 需要 经 过 实验 来 发 现 如 何 编译 这 些 源 文 件 。 最 常见 的 
情况 是 ， 系 统 已 安装 了 gdbm， 并 且 它 在 默认 情况 下 束 文 持 了 ndbm 兼 容 
FEI, Red Hat 发 行 版 融 是 这 样 的 。 在 这 种 情况 下 ， 你 需要 执行 如 下 操 


VE 

(1) 在 C 源 文件 中 包含 头 文件 ndbm.h。 

(2) 使 用 编译 行 选项 -Uusrwinclude/gdbm 包 含 头 文件 目 
录 /usr/include/gdbm。 

(3) 使 用 编译 行 选项 -lgdbm 链 接 gdbm 库 。 

如 果 这 不 起 作用 ， 一 种 常见 的 选择 (也 是 最 近 的 Ubuntu 和 SUSE 友 
行 版 使 用 的 方法 ) 是 : 系统 已 安装 了 gdbm， 但 在 需要 ndbm 兼 容 模 式 
时 ， 你 必须 明确 地 指定 它 ， 并 且 你 可 能 需要 在 链接 主 函 数 库 之 前 链接 莱 
容 库 。 你 需要 做 的 具体 操作 如 下 所 示 。 


(1) ECH LFF LAA 3 fF gdbm-ndbm.hifi 4 zéndbm.h. 

(2) 使 用 编译 行 选项 -IJusrwinclude/gdbm 包 含 头 文件 目 
>K/usr/include/gdbm 。 

(3) 使 用 编译 行 选项 -ljgdbm_compat-lgdbm 链 接 其 他 的 gdbm 兼 容 


库 。 

可 下 载 的 Makefile 文 件 和 dbm ”CC 源 文件 都 被 默认 设置 为 使 用 第 一 种 
选择 ， 但 它们 都 包含 注释 以 说 明 如 何 可 以 通过 编辑 方便 地 切换 到 使 用 第 
meas 在 本 章 的 剩余 部 分 ， 我 们 将 假设 你 的 系统 默认 就 支持 ndbm 

容 模式 。 


7.3.2 ”dbm 例 程 


和 我 们 在 第 6 章 中 讨论 的 curses 函 数 库 一 样 ，dbm 也 是 由 头 文件 和 库 
文件 组 成 ， 而 且 库 文件 必须 在 程序 被 编译 时 链接 进来 。 库 文件 被 简称 为 
dbm， 但 因为 我 们 通常 在 Linux 中 使 用 的 是 GNU 的 dbm 实 现 ， 所 以 我 们 需 
要 在 编译 行 中 使 用 选项 -lgdbm 来 链接 这 个 实现 。 其 头 文件 是 ndbm.h。 

在 开始 解释 每 个 dbm 孙 数 之 前 ， 你 必须 明白 dbm 数 据 库 能 够 做 什 
么 ， 这 一 点 很 重要 。 一 旦 明白 了 这 个 ， 你 就 能 更 好 地 理解 该 如 何 使 用 
dbm žit. 

dbm 数 据 库 的 基本 元 素 是 需要 储存 的 数据 块 以 及 与 它 关 联 的 在 检索 
数据 时 用 作 关 键 字 的 数据 块 。 每 个 dbm 数 据 库 必须 针对 每 个 要 存储 的 数 
据 块 有 一 个 唯一 的 关键 字 。 关 键 字 的 取 值 被 用 作 存 储 数据 的 索引 。dbm 
对 于 关键 字 和 数据 没有 限制 ， 对 使 用 超 长 关键 字 和 数据 的 情况 也 未 定义 
任何 错误 。 规 苑 允许 具体 实现 把 关键 字 / 数 据 对 的 长 度 限 制 为 1 023 个 字 
节 ， 但 具体 实现 通常 不 会 进行 限制 ， 这 是 因为 具体 实现 往往 要 比 技术 规 
范 所 要 求 的 更 灵活 。 

为 了 操纵 这 些 数据 块 ， 头 文件 ndbm.h 定 义 了 一 个 名 为 datum 的 新 数 
据 关 柑 。 该 闫 型 确切 的 扩容 依赖 于 具体 实现 ， 但 它 全 少 包 含 下 面 两 个 成 
TAs 

void *dptr; 

size_t dsize 

datum 是 一 个 用 typedef 语 句 定义 的 类 型 。 在 ndbm.h 文 件 中 还 为 dbm 
声明 了 一 个 类 型 定义 ， 它 是 一 个 用 来 访问 数据 库 的 结构 ， 其 作用 和 用 来 
访问 文件 的 FILE 结 构 很 相似 。dbm 类 型 定义 的 内 部 结构 依赖 于 具体 实 
现 ， 它 决 不 允许 被 直接 使 用 。 

在 使 用 dbm 库 时 ， 如 果 要 引用 一 个 数据 块 ， 你 必须 声明 一 个 datum 
类 型 的 变量 ， 将 成 员 dptr 指 同 数 据 的 起 始点 ， 并 把 成 员 dsize 设 为 包含 数 


据 的 长 度 。 无 论 是 竺 存储 的 数据 或 是 用 来 访问 它 的 索引 都 总 是 通过 这 个 
datum 类 型 来 引用 。 

你 最 好 将 dbm 类 型 看 作为 类 似 于 FILE 的 类 型 。 当 打开 一 个 dbm 数 据 
库 时 ， 通 和 常会 创建 两 个 物理 文件 ， 它 们 的 后 缀 分 别 是 .pag 和 .dirY， 并 返回 
一 个 dbm 指 针 ， 它 被 用 来 访问 这 两 个 文件 。 这 两 个 文件 决 不 应 该 被 直接 
读 写 ， 对 它们 的 访问 只 能 通过 dbm 例 程 来 进行 。 

在 一 些 实现 中 ， 这 两 个 文件 被 合并 到 一 起 ， 打 开 数 据 库 只 会 创 

建 一 个 文件 。 


如 果 对 SQL 数据 库 很 熟悉 ， 你 会 发 现 dbm 数 据 库 没有 与 之 关联 的 表 
格 或 列 结构 。 这 些 结构 对 于 dbm 数 据 库 来 说 并 不 是 必需 的 ， 因 为 dbm 不 
仅 对 每 存储 的 每 个 数据 项 没有 固定 长 度 的 要 求 ， 而 且 对 数据 的 内 部 结构 
也 无 要 求 。dbm 数 据 库 工作 在 非 结构 化 的 二 进 制 数据 块 基础 上 。 


7.3.3 dbm 访 问 疯 数 


现在 我 们 已 介绍 了 dbm 库 工作 的 基础 ， 下 面 我 们 可 以 来 具体 看 看 它 
提供 的 函数 。 主 要 的 dbm 函 数 的 原型 如 下 所 示 : 


得 lud dim. h 
DBM *dbm _ openic t ch filename, int fil p lag mode t mode) 

t dbm st (DBM *datab. descripto fatum key, datum t t mode) 
datum dbm tch(DBM *datab descript Gatum key 


void dbm_close(DBM *database_ descriptor); 
1. dbm_open t ži 


这 个 函数 用 来 打开 已 有 的 数据 库 ， 也 可 以 用 来 创建 新 数据 库 。 
filename 参 数 是 一 个 基本 文件 名 ， 它 不 包含 .dir 或 .pag 后 级 。 

其 余 的 参数 和 第 3 章 中 的 open 函 数 的 第 二 个 和 第 三 个 参数 一 样 。 你 
可 以 使 用 相同 的 #define 定 义 。 第 二 个 参数 控制 数据 库 的 读 、 写 或 读 / 写 
权限 。 如 果 要 创建 一 个 新 的 数据 库 ， 这 个 标志 必须 与 O_CREAT 进 行 二 
进 制 或 才 允 许 文 件 被 创建 。 第 三 个 参数 指定 将 被 创建 的 文件 的 初始 权 


dbm_open 返 回 一 个 指向 DBM 类 型 的 指针 。 它 被 用 于 所 有 后 续 对 数 
据 库 的 访问 。 如 果 失 败 ， 它 将 返回 (DBM * 0. 


2. dbm_store 函 数 


你 用 这 个 函数 把 数据 存储 到 数据 库 中 。 如 前 所 述 ， 所 有 数据 在 存储 


时 都 必须 有 一 个 唯一 的 索引 。 为 了 定义 你 想 要 存储 的 数据 和 用 来 引用 它 
的 索引 ， 你 必须 设置 两 个 datum 类 型 的 参数 : 一 个 用 于 引用 索引 ， 一 个 
用 于 实际 数据 。 最 后 一 个 参数 store_ mode 用 于 控制 当 试 图 以 一 个 已 有 的 
关键 字 来 存储 数据 时 会 发 生 的 情况 。 如 果 它 被 设置 为 dbm_insert， 存 储 
操作 将 失败 并 且 dbm_store 返 回 1。 如 果 它 被 设置 为 dbm_replace， 则 新 数 
据 将 履 盖 已 有 数据 并 且 dbm_store 返 回 0。 当 发 生 其 他 错误 时 ，dbm_store 
将 返回 一 个 负 值 。 


3. dbm_fetchpé 2 


dbm_fetcheé žr H FA ACHE Be Fr RE. EE SSE BIT 
dbm_open 调 用 返回 的 指针 和 一 个 指 同 关键 字 的 datum 类 型 结构 作为 其 参 
数 。 它 返回 一 个 datum 类 型 的 结构 。 如 果 在 数据 库 中 找到 与 这 个 关键 字 
关联 的 数据 ， 返 回 的 datum 结 构 的 dptr 和 dsize 成 员 的 值 将 被 设 为 相应 数据 
的 值 。 如 果 没 有 找到 关键 字 ，dptr 将 被 设置 为 null。 


要 记 住 的 是 ，dbm_fetch 返 回 的 datum 类 型 结构 中 仅仅 包含 一 
个 指 回 数据 的 指针 。 实 际 数据 依然 保存 在 dbm 库 的 本 地 存储 空间 
中 7 你 在 继续 调用 dbm 函 数 前 ， 必 须 把 数据 复制 到 程序 的 变量 中 


pA 


才 行 。 


4. dbm_ close 函数 


这 个 函数 关闭 用 dbm_open 打 开 的 数据 库 。 它 的 参数 是 先前 
dbm_open 调 用 返回 的 dbm 指 针 。 


X 验 一 个 简单 的 dbm 数 据 库 
在 学 习 了 dbm 数 据 库 的 基本 函数 之 后 ， 你 可 以 开始 编写 第 一 个 dbm 
程序 dbml.c 了 。 在 这 个 程序 中 ， 你 将 使 用 一 个 名 为 test_data 的 结构 。 
(1) 程序 的 开始 部 分 是 ##nclude 语 句 、#define 定 义 、main 函 数 和 
test_data 结 构 的 声明 : 


#inclu 
tdefine T_DB_FILE */tmp/dbal_test* 
tdefine M 
3 testi a 
har misc_char 
in my r 
har more_cha 


(2) 在 main 函 数 中 ， 设 置 了 items to storefllitems received 两 个 结 
构 ， 还 设置 了 关键 字 字 符 串 和 datum 结 构 : 


M 


r test_cata items_to_store[ITEMS_USED] ; 
struct test_data item_retrieved; 
char key_ 
an a» 


(3) 在 声明 了 一 个 指 癌 dbm 类 型 结构 的 指针 后 ， 现 在 打开 测试 数 
据 库 用 来 读 写 ， 如 有 果 需 要 就 创建 它 : 


d (TEST_DB_FILE RDWR LAT 
f (!dbmptr) { 
fprintf(stderr, "Failed to open database\n" 


exit (EXIT_FAILURE) ; 


(4) 现在 添加 一 些 数据 到 items to_store 结 构 中 : 


moaset (atems_to store) 


O 你 需要 为 每 个 数据 项 建立 一 个 供 以 后 引用 的 关键 字 。 它 被 设 
为 每 个 字符 串 的 头 一 个 字母 加 上 整数 。 这 个 关键 字 由 key_datum 标 识 ， 


而 data_datum 则 指 问 items_to_store 数 据 项 。 然 后 将 数据 存储 到 数据 库 
H, 


a E 
数据 库 : 


编译 并 运行 这 个 程序 ， 它 的 输出 如 下 所 示 : 
5 gcc -o dbmi -I/usr/include/gdbm dbml.c -lgdba 
-/dbm1 


如 果 gdbm 是 以 兼容 模式 安装 的 ， 这 就 是 你 将 获得 的 输出 结果 。 如 
果 编 译 失 败 ， 你 可 能 需要 修改 源 文件 中 的 ##include 语 句 ， 按 照 源 文件 中 
注释 说 明 的 方法 ， 用 gdbm-ndbm.h 文 件 蔡 换 ndbm.h， 并 在 编译 源 文 件 
时 ， 在 链接 主 函 数 库 之 前 先 链接 兼容 库 ， 如 下 所 示 : 

实验 解析 

首先 ， 打 开 数 据 库 ， 如 果 需 要 就 创建 它 。 接 着 ， 填 充 作 为 测试 数据 
的 items_to_store 的 3 个 成 员 。 针 对 每 个 成 员 ， 你 分 别 创建 一 个 索引 关键 


Al 为 简单 起 见 ， 你 使 用 两 个 字符 串 的 头 一 个 字符 再 加 上 整数 来 构成 关 
Te 

然后 ， 设 置 两 个 datum 结 构 ， 一 个 用 于 关键 字 ， 另 一 个 用 于 存储 的 
数据 。 在 把 3 个 数据 项 存储 到 数据 库 中 之 后 ， 你 构建 一 个 新 的 关键 字 并 
设置 一 个 datum 结 构 来 指向 它 。 然 后 ， 使 用 这 个 关键 字 来 从 数据 库 中 检 
索 数 据 。 通 过 检查 返回 的 datum 结 构 中 的 dptr 成 员 是 人 否 为 null， 来 判断 检 
索 是 否 成 功 。 假 设 它 不 是 null， 你 就 可 以 把 检索 到 的 数据 《〈 它 可 能 储存 
在 dbm 库 的 内 部 空间 中 ) 复制 到 你 自己 的 结构 中 。 注 意 ， 要 使 用 
dbm_fetch 返 回 的 长 度 值 (如 果 不 这 样 做 ， 并 且 使 用 的 是 可 变 长 数据 ， 
你 可 能 就 会 复制 根本 不 存在 的 数据 ) 。 最 后 ， 打 印 检索 到 的 数据 来 验证 
是 否 正 确 获 取 了 数据 。 


7.3.4 ”其 他 dbm 员 类 


现在 你 已 知道 了 主要 的 dbm 函 数 ， 本 节 我 们 将 介绍 用 于 dbm 数 据 库 
的 一 些 其 他 函数 : 
int dbm delete(DBM *database descriptor, datum key); 
int dbm_error(DBM *database descriptor); 
int dbm clearerr(DBM *database descriptor); 
datum dbm firstkey(DBM *database_ descriptor); 
datum dbm nextkey(DBM *database descriptor); 


1. dbm_delete 2 

dbm_delete 函 数 用 于 从 数据 库 中 删除 数据 项 。 与 dbm_fetch 一 样 ， 它 
也 使 用 一 个 指 问 关键 字 的 datum 类 型 结构 作为 其 参数 ， 但 不 同 的 是 ， 它 
是 用 于 删除 数据 而 不 是 用 于 检索 数据 。 它 在 成 功 时 返回 0。 

2. dbm_error f žk 


dbm_error 函 数 只 是 用 于 测试 数据 库 中 是 否 有 错误 发 生 ， 如 果 没 有 
IR EIO. 


3. dbm_clearerr r 2 


dbm_clearerr 函 数 用 于 清除 数据 库 中 所 有 已 被 置 位 的 错误 条 件 标 


Ct 


4. dbm_firstkey#l!dbm_nextkey P% žr 


这 两 个 函数 一 般 成 对 使 用 来 对 数据 库 中 的 所 有 关键 字 进 行 扫 描 。 它 
们 需要 的 循环 结构 如 下 所 示 : 


Yikey = dtm tirstxey(db pt: key.Gptr; key = dom_nextkey(db ptr 


实 验 检索 和 删除 

在 本 例 中 ， 使 用 上 面 介 绍 的 新 函数 对 dbml.c 做 一 些 改进 。 下 面 是 
dbm2.c 的 源 代码 : 

(1) 复制 一 份 dbm1.c， 打 开 它 进行 编辑 。 修 改 #define 
TEST_DB_FILE 一 行 : 


include <unistd.h> 
finc de <stå h> 


tinclude <stdio.h> 

tin lude <fcntl.h> 
je <ndbm.h> 

sinciude <string.h> 


#define TEST_DB_FILE */tmp/dbm2_test* 
idefine ITEMS_USED 3 


(2) 然后 只 需要 修改 检索 数据 的 部 分 : 


/* now try to delete some data */ 


ey_t JS5e 


atun. daisi 
if (dbm _delete(dbm ptr, key _ datum) == 0) { 
printf ("Data with key ts deleted\n", key_to_use); 


else { 
printf ("Nothing deleted for key @s\n", key_to_use) ; 


for (key datum = dbm_firstkey(dbm_ ptr); 
key atum. dptr; 
key datum = dba nextkey (dba ptr})) ( 
t latum = pe ferch(dbm ptr ke 


a it f bm ptr, 
jata_d i ( 
nef ta ved ; 
p emr vec ta_ apt m 
tem > % a 
w red ,misc_ch 
m ed. „int 
一 eve re_cha 


$ ,/dbm2 


实验 解析 

这 个 程序 的 第 一 部 分 同 前 面 的 例子 完全 一 样 ， 只 是 往 数 据 库 里 储存 
Poa 然后 构建 一 个 关键 字 来 匹配 第 二 个 数据 项 ， 并 把 它 从 数据 库 

删除 。 

接 下 来 ， 这 个 程序 使 用 dbm_firstkey 和 dbm_nextkey 依 次 访问 数据 库 
中 的 每 个 关键 字 ， 并 检索 数据 。 注 意 ， 数 据 的 获取 并 不 是 按 序 的 : 按 关 
键 字 的 顺序 检索 数据 并 不 意味 着 获取 的 数据 是 有 序 的 ， 它 只 是 一 种 扫描 
所 有 数据 项 的 方式 。 


7.4 CD 唱片 应 用 程 请 


在 学 习 了 环境 和 数据 管理 之 后 ， 现 在 是 时 候 改进 这 个 应 用 程序 了 。 
a a 
TI o 


7.4.1 i 


因为 这 次 的 更 新 会 涉及 大 量 代码 的 重 写 ， 所 以 现在 是 个 重新 审视 设 
计 决 策 以 查看 哪些 地 方 需要 改进 的 好 时 机 。 虽 然 在 文件 中 以 逗号 分 隔 变 
量 来 存储 信息 是 一 种 在 shell 中 很 容易 实现 的 方式 ， 但 这 样 做 的 局 限 性 也 
很 大 ， 因 为 许多 CD 标题 和 曲目 都 包含 逗号 。 你 可 以 通过 使 用 dbm 数 据 库 
来 完全 放弃 这 种 分 隔 方法 ， 这 也 是 我 们 需要 改变 的 一 个 设计 元 素 。 

人 
‘eM. 

前 面 的 实现 多 少 都 存在 着 这 样 一 个 问题 ， 即 将 应 用 程序 的 数据 访问 
部 分 和 用 户 接口 部 分 混在 了 一 起 ， 这 与 程序 全 实现 在 一 个 文件 中 有 很 大 
的 关系 。 在 这 个 新 的 实现 中 ， 你 将 用 一 个 头 文 件 来 描述 数据 和 用 于 访问 
它 的 例 程 ， 并 将 用 户 接口 代码 和 数据 处 理 代 码 分 别 放 到 两 个 文件 中 去 。 

虽然 可 以 继续 用 curses 来 实现 用 户 接口 ， 但 本 次 实现 将 返回 到 简单 
的 基于 行 的 系统 。 这 不 仅 使 应 用 程序 的 用 户 接口 部 分 既 短小 又 简单 ， 而 
且 可 以 把 精力 集中 到 其 他 实现 方面 上 去 。 

虽然 还 不 能 在 dbm 代 码 中 使 用 SQL 语句 ， 但 可 以 使 用 SQL 术语 以 更 
正规 的 方式 来 描述 新 数据 库 。 如 果 还 不 熟悉 SQL 语句 ， 不 用 担心 ， 我 们 
会 解释 这 些 定 义 。 你 还 将 在 第 8 章 中 看 到 更 多 对 SQL 语句 的 介绍 。 表 可 
以 用 下 面 的 代码 来 描述 : 


RIMAR) n 


这 个 非常 简洁 的 描述 表明 数据 域 的 名 字 和 长 度 。cdc_entry 表 中 每 个 
记录 都 有 一 个 唯一 的 catalog 列 。cdt_entry 表 中 曲目 号 不 能 为 零 ， 而 且 


catalog 和 track_no 两 列 的 组 合 是 唯一 的 。 你 将 在 下 一 节 的 代码 中 看 到 这 
些 描 述 被 定义 为 typedef struct 结 构 。 


7.4.2 dbm# CD 唱片 应 用 程 


你 现在 将 通过 使 用 dbm 数 据 库 存储 信息 的 方法 来 重新 实现 应 用 程 
序 。 整 个 应 用 程序 共有 3 个 文件 ， 它 们 是 cd_data.h、app_ui.c 和 
cd_access.c。 

你 还 将 把 用 户 接 口 重 写 为 命令 行程 序 。 在 本 书 的 后 面 章节 中 ， 你 将 
看 到 使 用 不 同 的 客户 /服务 器 机 制 来 实现 应 用 程序 ， 并 最 终 将 其 实现 为 
一 个 能 够 通过 Web 浏 览 器 跨 网 络 访问 的 应 用 程序 ， 到 那 时 ， 你 还 将 重用 
这 里 的 数据 库 接 口 和 一 部 分 的 用 户 接口 。 把 接口 转换 为 更 简单 的 命令 行 
驱动 接口 ， 使 你 能 更 容易 关注 应 用 程序 最 重要 的 部 分 ， 而 不 是 用 户 接 


口 。 
你 将 在 后 面 的 章节 中 看 到 ， 数 据 库 的 头 文件 cd_data.h 和 来 目 文 件 
cd_access.c 里 的 函数 被 多 次 重用 。 


请 记 住 ， 有 些 Linux 发 行 版 需要 稍微 不 同 的 编译 选项 ， 如 在 C 
源 文件 中 包含 头 文件 gdbm-ndbm.h 而 不 是 ndbm.h， 使 用 - 
lgdbm_compat -lgdhm 而 不 是 只 使 用 -ljgdbm。 如 果 你 的 Linux 发 行 
a 于 这 种 情况 ， 就 需要 对 文件 access.c 和 Makefile 进 行 适当 的 
SL. 


实 验 cd_datah 
我 们 从 头 文件 开始 ， 它 定义 了 数据 的 结构 和 用 于 访问 这 些 数据 的 例 


(1) 下 面 是 CD 数据 库 的 数据 结构 的 定义 。 它 定义 了 组 成 数据 库 的 
两 个 表 的 结构 和 大 小 。 首 先 定 义 了 几 个 将 会 用 到 的 数据 域 长 度 以 及 两 个 
结构 : 一 个 用 于 标题 数据 项 ， 男 一 个 用 于 曲目 数据 项 : 


O 
o 


/* The catalog table * 
#define CAT_CAT_LEN 0 
ddefine CAT_TITLE_LEN 70 


ddefine CAT TYPE LEN 30 
#define CAT_ARTIST_LEN 70 
ypedef ru 
char catalog|[CAT_CAT_LE 
cha e(CAT_TITLE_LE 
ar type(CAT_TYPE_LEN ] 
ar artist {CAT_ARTIST_LEN } 
} edc_entry 
/* The tracks table, one entry per track */ 
fdefine TRACK_CAT_LEN CAT_CAT_LEN 


define TRACK _TTEXT_LEN 70 


typedef struct 
char catalog[TRACK_CAT_LEN + 


o; 
char track_txt[(TRACK_TTEXT_LEN + 1]; 


数 负 贡 处 理 曲 目 数 据 项 : 


(2) 在 定义 了 一 些 数据 结构 后 ， 你 可 以 开始 定义 一 些 需要 的 访问 
HET. RBZ PLA cdc. 的 函数 负责 处 理 标题 数据 项 ， 


含 cdt 的 函 


注意 ， 有 些 函 数 直 接 返 回 数 据 结 构 。 你 可 以 通过 强制 设置 这 


些 结构 的 内 容 为 空 ， 来 表明 函数 调用 失败 。 


/* Initialization and termination functions */ 
int database_initialize(const int new_database) ; 
void database_close(void); 


* two for simple data retrieval */ 
cde_entry get_cdc_entry(const char *cd_catalog_ptr); 
cdt_entry get_cdt_entry(const char *cd_ catalog ptr, const int track no); 


/* two for data addition */ 
int add_cdc_entry(const cdc_entry entry_to_add); 
int add_cdt_entry(const cdt_entry entry_to_add); 


/* two for data deletion */ 
int del_cde_entry(const char *cd_ catalog _ptr); 
int del_cdt_entry(const char *cd_catalog_ptr, const int track_no); 


/* one search function */ 
cdc entry search_cdc_entry(const char *cd_catalog_ ptr, int *first_call_ptr); 


S 验 app_ui.c 


现在 开始 介绍 用 户 接口 。 这 部 分 程序 相对 来 说 比较 简单 ， 它 实现 在 


一 个 单独 的 文件 中 ， 你 将 用 它 来 访问 数据 库 函 数 。 
C1) TAGE PE, MSR CHP IP aA: 


#define _XOPEN_SOURCE 


#include <stdlib.h> 
include <unistd.h> 
#include <stdio.h> 
#include <string.h> 


finclude *cd_data.h* 


#tdefine TMP_STRING_LEN 125 /* this number must be larger than the biggest 
single string in any database structure */ 


(2) 用 typedef 语 名 定义 菜单 选项 。 这 要 比 用 #define 语 句 定义 常量 
的 方法 好 ， 因 为 它 允 许 编译 器 检查 末 单 选项 变量 的 类 型 : 


typedef enim { 
mo_invalid, 
mo_add_cat, 
mo_add_tracks, 
mo_del_cat, 
mo_ find cat, 
mo_list_cat_tracks, 
mo_del_tracks, 
mo_count_entries, 
mo exit 

} menu options; 


(3) 现在 开始 编写 各 种 局 部 函数 的 原型 。 记 住 ， 实 际 访问 数据 库 
的 函数 的 原型 是 通过 头 文件 cd_datah 包 含 进来 的 : 


static int command_mode(int argc, char *argv[]); 


static void announce (void) ; 

static menu_options show_menu(const cdc_entry *current_cdc)}; 
static int get_confirm(const char *question); 

static int enter_new_cat_entry(cdc_entry *entry_to_update); 
static void enter_new_track_entries(const cdc_entry *entry_to_add_to); 
static void del_cat_entry(const cdc_entry ‘*entry_to_delete); 
static void del_track_entries(const cdc_entry *entry_to_delete); 
static cde_entry find_cat (void); 

static void list_tracks(const cdc_entry ‘entry_to_use); 

static void count_all_entries(void) ; 

static void display_cdc(const cde_entry *cdc_to_show); 

static void display_cdti(const cdt_entry *cdt_to_show) ; 

static void strip_return(char *string_to_strip); 


(4) 最 后 ， 到 了 main 函 数 。 它 先 对 current_cdc_entry 结 构 进 行 初始 
化 ， 用 它 来 保存 当前 选中 的 CD 标题 项 。 还 解析 了 命令 行 ， 宣 布 正在 运 
行 的 是 哪个 程序 ， 并 初始 化 数据 库 : 


void main(int argc, char *argv[)}) 
menu_options current option; 
edc_entry current cdc entry; 
int command_result; 


memset (&current_cdc_entry, ‘\0', sizeof{current_cdc_entry)); 
if (argc > 1) { 
command_result = command_mode(arge, argv); 
exit (command_result) ; 
announce ()} ; 
if (!database_initialize(0)) { 
fprintf(stderr, *Sorry, unable to initialize database\n"); 


fprintf(stderr, "To create a new database use ts -i\n", argv[0}); 
exit (EXIT_FAILURE) ; 


(5) DUE CME EAHA aA BEA “MIB, EA at 
择 一 个 菜单 选项 ， 然 后 处 理 它 ， 直 到 用 户 选 择 退 出 选项 为 止 。 注 意 ， 把 
current_cdc_entry 结 构 传 递 给 show_menu 函 数 。 这 是 为 了 让 菜单 选项 能 够 
根据 用 户 当 前 选择 的 标题 项 做 相应 的 改变 : 


void main(int argc, char *argv[)}) 


{ 


menu_options current_option; 
cadc_entry current cdc entry; 
int command_result; 


memset (&current_cdc_entry, *\0', sizeof(current_cdc_entry)); 


if (argc > 1) { 
command_result = command_mode(arge, argv); 
exit (command_result); 


announce ()} ; 


if (!database_initialize(0)) { 

fprintf(stderr, "Sorry, unable to initialize database\n"); 
fprintf(stderr, "To create a new database use ts -i\n", argv[0}); 
exit (EXIT_FAILURE) ; 


(6) 主 循环 退出 时 ， 关 闭 数 据 库 并 退回 到 环境 。announce 函 数 用 
于 输出 欢迎 辞 : 


(7) 下 面 列 出 了 show_menu 函 数 的 内 容 。 这 个 函数 通过 标题 名 的 
第 一 个 字符 来 检查 当前 标题 项 是 售 被 选中。 如 林 选 择 了 一 个 标题 项 ， 用 
户 将 看 到 更 多 的 菜单 选项 : 


注意 ， 现 在 要 用 数字 来 选择 来 单项 ， 而 不 像 在 前 两 个 例子 中 
ABE BEAD a EF 


printf(*\n\nCurrent entry: ")}; 

printf (*ts, 
cdc_selected->title, 
cdc_selected->type, 
cdce_selected->artist) 


ts, ts, ts\n",. cdc_selected->catalog, 


printf (*\n*); 


printf(*l 
printf£(*2 
print£("3 
printf("4 
printf{"5 
printf{"6 
printf(*q 


add new CD\n"); 

search for a CD\n"); 

count the CDs and tracks in the database\n"); 
re-enter tracks for current CD\n"); 

delete this CD, and all its tracks\n"); 

list tracks for this CD\n"); 

quit\n"); 


printf£(*\nOption: °); 
fgets(tmp_str, TMP_STRING_LEN, stdin); 


switch | tmp 


case 
case 


case “ 


case 
case 


case ' 


case 
) 

) 

else { 


strf0}) { 
*'; option_chosen = mo_add_cat; break; 


option_chosen = mo_find_cat; break; 

: option_chosen = mo_count_entries; break; 
: option_chosen = mo_add tracks; break; 

: option_chosen = mo_del_cat; break; 


': option_chosen = mo_list_cat_tracks; break; 


; option chosen = mo_exit; break; 


printf(*\n\n*); 


printf(*"1 
printft(*2 
printf (*3 
printf ("q 


add new CD\n"); 
search for a CD\n"); 


- count the CDs and tracks in the database\n"); 


quit\n"); 


printf(*\nOption: *); 
fgets(tmp_str, TMP_STRING_LEN, stdin); 
switch(tmp_str[0}) [ 


case 
case 
case 
case 
j 
} 
) /* while */ 


hy 


2*1 
AS 
‘at: 


: option_chosen = mo_add_cat; break; 
option_chosen = mo_find cat; break; 
option_chosen = mo_count_entries; break; 
option chosen = mo_exit; break; 


return (option_chosen) ; 


(8) 你 需要 在 多 个 地 方 询问 用 户 ， 让 用 户 确 认 他 的 请 求 。 我 们 并 
未 让 这 上 段 提问 代码 多 次 出 现在 程序 中 ， 而 是 抽取 这 段 代 码 组 成 一 个 单独 
的 函数 get_confirm: 


static int get_confirm(const char *question) 


i 


char tmp_str[TMP_STRING_LEN + 1); 


printf (*ts", question); 
fgets(tmp_str, TMP_STRING_LEN, stdin); 
if (tep_str[0] == 'Y' || tmp_str{0) == ‘y')} { 


return({1); 
} 


return(0); 


(9) 函数 enter_new_cat_entry 的 作用 是 让 用 户 输入 一 个 新 的 标题 
。 你 并 不 想 保 存 由 fgets 函 数 返 回 的 换行 符 ， 所 以 把 它 去 挥 : 


意 ， 你 没有 
出 。 你 应 冲 是 中 壁 免 使 用 gets 函 数 ! 


static int enter_new_cat_entry(cdc_entry *entry_to_update) 
ede_entry new entry; 
char tmp_str[TMP_STRING_LEN + 1); 


memset(&new_entry, '\0', sizeof (new_entry)); 


printf(*Enter catalog entry: "); 

(void) fgets(tmp_str, TMP_STRING_LEN, stdin); 
strip_return(tmp_str) ; 

strncpy (new_entry.catalog, tmp str, CAT CAT_LEN - 1); 


printf("Enter title: "); 

(void) fgets (tmp str, TMP_STRING_LEN, stdin); 
strip_return(tmp_str}; 

strncpy(new_entry.title, tmp_str, CAT_TITLE_LEN - 1); 


rintf("Enter type: °); 

(void) fgets(tmp_str, TMP_STRING_LEN, stdin); 
strip_return(tmp_str}; 

strncpy (new_entry.type, tmp_str, CAT_TYPE_LEN ~ 1); 


printf(*Enter artist: °); 

(void) fgets(tmp_str, TMP_STRING_LEN, stdin); 
strip_return(tmp_str}; 

strncpy(new_entry.artist, tmp_str, CAT_ARTIST_LEN - 1); 


printf(*\nNew catalog entry entry is :-\n"); 

display_cdc (&new_entry) ; 

if (get_confirm("Add this entry ?*)} { 
memcpy (entry_to_update, anew_entry, sizeof (new_entry)); 
return(1); 

} 

return(0); 


(EH gets ži Ae TIAR A RTT X ze n ii 


| 


(10) 下 面 是 用 于 输入 曲 ee new_track entries. ix 


个 函数 比 标题 项 函数 要 稍微 复杂 一 点 ， 因 为 你 允许 保留 已 经 存在 的 曲目 


项 : 


static void enter_new_track_entries|const cdc_entry *entry_to_add_to) 
edt_entry new_track, existing_track; 
char tmp_str[TMP_STRING_LEN + 1}; 
int track_no = 1; 
if (entry_to_add_to->catalog[0] == ‘\0') return; 


princf(*\nUpdating tracks for s\n", entry_to_add_to->catalog) ; 
printf(*Press return to leave existing description unchanged, \n"); 
printi(* a single d to delete this and remaining tracks, \n"}; 
printf(* or new track description\n") 


while(1) { 


(11) Ac, AWRA SA H A See GOA AE. WEA 


询 结 果 ， 程 序 将 对 提示 做 相应 的 修改 : 


= è ) zeo ew_track) 
x J J try try _add ata 
rac o); 
ng tra cat ] 
n "\tTx td t 5 
exi t t 
pr ext 
p | ript a n 
fgets (tmp_str, TMP STRING LEN, stdin); 
strip_return {tmp 


(12) 如 条 当前 曲目 编号 处 没有 现存 曲目 ， 而 且 用 户 也 未 添加 一 条 
记录 ， 则 程序 就 认为 曲目 都 已 经 添加 完毕 了 : 


(13) 如 果 用 户 输入 一 个 单独 的 字符 d4， 这 将 会 删除 当前 以 及 更 高 
编号 的 曲目 记录 。 如 果 del_cdt_entry 函 数 找 不 到 待 删 除 的 曲目 ， 它 将 会 
返回 false: 


while (del_cdt_entry(entry_to_add_to->catalog, track no) { 


(14) 下 面 这 段 代 码 的 作用 是 添加 一 个 新 的 曲目 或 者 更 新 一 个 现 有 
曲目 。 首 先 构建 一 个 cdt_entry 结 构 new_track， 然 后 调用 数据 库 函 数 
add_cdt_entry 来 把 它 添加 到 数据 库 中 : 


(14) 下 面 这 段 伐 码 的 作用 是 深 加 一 个 新 的 曲目 或 者 更 新 一 个 现 有 曲目 。 首 先 构 建 
和 数据库 函 数 ad EVES RE 
og, er 
iCk 
ack 
ed t 


(15) 函数 del_cat_entry 删 除 一 个 标题 项 。 如 果 标 题 项 被 删除 了 ， 


那么 原来 属于 它 的 曲目 记录 也 都 将 被 删除 : 


(16) 接 下 来 这 个 函数 的 作用 是 删除 与 茶 个 标题 项 对 应 的 所 有 曲 


C17) 下 面 是 一 个 非常 简单 的 标题 搜索 函数 。 它 允许 用 户 输 入 一 个 
字符 串 ， 然 后 俘 找 包含 这 个 字符 串 的 标题 项 。 因 为 可 能 存在 多 个 匹配 的 
记录 ， 所 以 只 是 依次 将 每 个 匹配 的 记录 提供 给 用 户 : 


static cdc_entry find_cat (void) 
{ 
edc_entry item_found; 
char tmp_str[TMP_STRING_LEN + 1}; 
int first_call = 1; 
int any_entry_found = 0; 
int string_ok; 
int entry_selected = 0; 


do { 
string_ok = 1; 
printf(*Enter string to search for in catalog entry: *); 
fgets(tmp_str, TMP_STRING_LEN, stdin}; 
strip_return(tmp_str); 
if (strlen(tmp_str) > CAT_CAT_LEN) { 
fprintf(stderr, “Sorry, string too long, maximum %d \ 
characters\n*, CAT_CAT_LEN); 
string_ok = 0; 
} 
} while [(!string_ok); 


while (fentry_selected) [ 
item_found = search_cdc_entry(tep_str, &first_call); 
if (item_found.catalog[0] t= '\0') { 
any_entry_found = i; 
printf(*\n"); 
display_cde («item found) ; 
if (get_confirm(*This entry? *)) ( 
entry_selected = 1; 
} 
) 
else { 
if (any_entry_found) printf£("Sorry, no more matches found\n"); 
else printf£(*Sorry, nothing found\n"); 
break; 
) 
} 
return (item_found) ; 


(18) list_tracks 函 数 用 于 输出 指定 标题 项 的 所 有 曲目 : 


static void list_tracks(const cdc_entry *entry_to_use) 
{ 

int track no = 1; 

cdt entry entry found; 


Gisplay_cdc (entry_to_use) ; 
printf (*\nTracke\n*) ; 
Go { 
entry_found = get_cdt_entry(entry_to_use->catalog, 
track no): 


if (entry_found.catalog/[0]) { 
display_cdt (sentry. found) ; 
track_no++; 
} 
} while(entry_found.catalog[0]); 
(void}get_confirm{"Press retum”); 
} /* list_tracks */ 


(19) count all_entries 函 数 用 于 统计 所 有 曲目 数量 : 


(20) 下 面 是 


iisplay cdc (cons 


display_cdc 函 数 ， 它 用 来 显示 一 条 标题 项 记录 : 


lc to_show 


display_cdt 函 数 的 作用 是 显示 一 条 曲目 项 记录 : 


| 


id 2 .Cor ry *cat_t how 


fitta: s\n” it_to_show->track no, cdt_to_show->track_txt); 


(21) strip_return 函 数 的 作用 是 删除 字符 串 尾 部 的 换行 符 。 记 住 ， 


Linux 同 UNIX 一 样 ， 使 用 一 个 单独 的 换行 符 来 表明 一 行 的 结 


t len; 


len = strien(string_to_strip); 


string_to_striplilen - 1] == '\n') string_to_strip[lien - 1) = 


(22) command_mode 是 一 个 对 命令 行 参 数 进 行 解析 的 函数 。 其 中 
调用 的 getopt 函 数 是 一 个 确保 程序 能 够 接受 符合 标准 Linux 规 范 的 参数 的 
好 方法 : 


int 

int resul EXIT. CCE. 

h name gvi0} 

* these ex ls used by get 

extern 

extern a e t 

hile = opt (a argi 
cas 


f (!database_initialize(i}) { 
result = EXIT_FAILURE; 
"Failed to initialize database\n"); 


tf (stderr, 


实 验 cd_access.c 

现在 开始 介绍 用 于 访问 dbm 数 据 库 的 函数 : 

(1) 与 往常 一 样 ， 你 从 包含 头 文 件 开始 。 然 后 用 #define 语 句 指 定 
将 用 来 存储 数据 的 文件 : 


tinclude <unistd.h> 
tinclude <stdlib.h> 


include <stdio.h> 
ti ide 
£ ude r 
a ndbm.n 
above may A d m ribu 
i i da 
f FILE. a 
IL dt 
è FIL dc 
’ FIL ic_d 
人 FII t 


“(2) 使 用 下 面 两 个 文件 范围 变量 追踪 当前 的 数据 库 ; 


DEM 


(3) 默认 情况 下 ，database_initialize 函 数 打 开 一 个 已 有 的 数据 库 ， 
但 通过 传递 一 个 非 零 的 〈 即 布尔 值 为 真 ) 参数 new_database 给 它 ， 你 束 
可 以 强迫 它 创建 一 个 新 的 〈 空 ) 数据 库 ， 并 有 效 地 删除 任何 已 有 的 数据 


库 。 如 果 数 据 库 被 成 功 初始 化 ， 那 么 两 个 数据 库 指针 也 被 初始 化 ， 以 此 
表明 数据 库 被 打开 : 


Ge, Ubas 


(4) database_closerk AH FRA CHIARA, FER SAE 
库 指 针 设 为 null， 以 此 表明 当前 没有 打开 的 数据 库 : 


(5) 接 下 来 这 个 函数 ， 当 给 它 传 递 一 个 指 同 标题 项 文本 字符 串 的 
旨 针 时 ， 它 将 检索 出 一 个 标题 项 来 。 如 果 标 题 项 没有 找到 ， 其 返回 数据 
中 的 标题 域 将 为 空 : 


ry(const char *cd_ catalog ptr) 


(6) 函数 先 做 一 些 完 整 性 检查 ， 确保 数据 库 已 打开 而 且 你 传递 了 
“n i C 


(7) 设置 dbm 函 数 需要 的 datum 结 构 ， 然 后 使 用 dbm_fetch 函 数 来 检 
索 数 据 。 如 果 没 有 数据 可 以 获得 ， 你 将 返回 先前 初始 化 过 的 空 的 


entry_to_return 结 构 : 


y atum. dp tin 
key_datum.dsize = sizeofientry_to find); 
TEN sal 2 tum tof 1 dat i, 
= _da n t "Gbm_r cal_key_da 
a a_Ga Iptr 
y ntr etu t Gata datum. dptr 


(8) 你 希望 还 能 对 一 个 单独 的 曲目 项 进行 检索 ， 这 正 是 下 面 这 个 
函数 实现 的 功能 。 它 与 get_cdc_entry 函 数 的 工作 方式 基本 类 似 ， 不 过 它 
需要 一 个 指 癌 标 题字 符 串 的 指针 和 一 个 曲目 编号 作为 参数 : 


it track_no 


entry ons h d_catalog_ptr = 


y_to_ T_LEN 
ja al 
datum cal_k = 
memset (&en t urn 
CC _re 
oC pt 
st -a r -个 u 
ét ear y f catalog entry 
and mbe 
memset (&e ee ntr ind 
printf (en ? ca_catalog t 
al_key_d try 
l_ke Y 
memset (&loca ata tum _data_ 
local data tum bm_fetct bm ke 
if -6 -a ta_ apt 
m yi&entr et ] Jat m. ap 
al data an 
et 


(9) 下 一 个 函数 add_cdc_entry 的 作用 是 增加 一 个 新 的 标题 项 记 


int add_cdce_entryiconst cdc_entry entry_to_add) 
{ 

char key_to_add[CAT_CAT_LEN + 1]; 

datum local _data_ datum; 

datum local_key_ datum; 

int result; 


/* check database initialized and parameters valid */ 
if (!cde_dbmptr || !cdt_dbm_ptr) return (0); 
if (strlen(entry_to_add.catalog} >= CAT_CAT LEN) return (0); 


/* ensure the search key contains only the valid string and nulls */ 
memset (&key_to_add, '\0', sizeof{key_to_add)); 
strcpy(key_to_add, entry_to_add.catalog}; 


local_key_datum.dptr = (void *) key_to_add; 
local_key_datum.dsize = sizeof (key_to_add); 
local _data_datum.dptr = (void *) &entry_to_add; 
local_data_datum.dsize = sizeof(entry_to_add); 


result = dbm_store(cdc_dbm_ptr, local_key_datum, local_data_datum, 
DBM_REPLACE) ; 


/* domstore() uses 0 for success */ 


if (result == 0) return (1); 
return (0); 


(10) add_cdt_entry K 2H EH eS 0 — “Sar h H Re Pavel 
字符 串 和 曲目 编号 组 合 在 一 起 构成 其 访问 关键 字 : 
int add_cdt_entry(const cdt entry entry_to_add) 
( 


char key_to_addlCAT CAT LEN + 10]; 
datum local_data_datum; 

datum local _key_datum; 

int result; 


if (!ede_dbm ptr || !cdt dbm ptr) return (0); 
if (strlenientry_to_add.catalog) >= CAT_CAT_LEN) return (0); 


memset (&key_to_add, ‘\0', sizeof(key_to_add)); 
sprintf (key_to_add, "$s #d*, entry_to_add.catalog, 
entry_to_add.track_no}; 


local_key_datum.dper = (void *) key_to_add; 
local_key_datum.dsize = sizeof (key_to_add) ; 
local_data_datum.dptr = (void *) sentry_to_add; 
local_data_datum.dsize « sizeof tentry_to_add); 


result = dbm_store(cdt_dbm ptr, local _key_datum, local _data_datum, 
DBM_REPLACE) ; 


/* Gom_store() uses 0 for success and -ve numbers for errors */ 
if (result == 0) 


return (1); 
return (0); 


(11) 既然 可 以 往 数 据 库 里 增加 数据 ， 你 最 好 还 能 删除 它们 。 下 面 
这 个 函数 的 作用 就 是 删除 标题 项 记录 : 


(12) 与 上 面 的 函数 类 似 ， 这 个 函数 用 于 删除 曲目 记录 。 记 住 ， 曲 
目 关 键 字 是 由 标题 项 字符 串 和 曲目 编号 两 者 构成 的 一 个 复合 索引 : 


(13) 最 后 非 背 重要 的 一 点 是 ， 你 还 有 一 个 简单 的 搜索 函数 。 它 不 
是 非常 复杂 ， 但 它 演示 了 如 何在 预先 不 知道 关键 字 的 情况 下 扫描 全 部 的 
dbm 记 录 项 。 

因为 你 事先 并 不 知道 会 有 多 少 匹 配 的 记录 项 ， 所 以 你 将 这 个 函数 实 
现 为 每 次 调用 返回 一 个 记录 项 。 如 果 什 么 也 没 找 到 ， 记 录 项 就 将 是 空 
的 。 为 了 扫描 整个 数据 库 ， 你 在 调用 这 个 函数 时 使 用 一 个 指 同 整数 的 指 
针 #first_call_prt， 它 在 函数 第 一 次 被 调用 时 应 被 设置 为 1， 然 后 这 个 函数 
就 知道 它 应 该 在 数据 库 的 起 始 处 开始 搜索 。 在 后 续 的 调用 中 ， 这 个 变量 
将 被 设置 为 0， 函 数 将 会 从 上 次 找到 记录 项 的 位 置 开 始 继续 搜索 。 

当 和 希望 重新 开始 搜索 时 ， 比 如 要 搜索 另外 一 个 标题 项 时 ， 你 必须 把 
*#first call _ptr 的 值 设 为 真 ， 然 后 再 次 调用 这 个 图 数 ， 这 将 重新 初始 化 搜 


AJN o 


FEIR “TABLE PU Yad AZ Te], PRES E N BRAS Ta oh REAL 
的 目的 是 器 客户 隐藏 继续 搜索 的 复杂 性 ， 同 时 保留 了 搜索 函数 在 具体 实 
现 方面 的 秘密 。 

人 Rae 那么 所 有 的 记录 项 都 将 被 认为 是 
匹配 的 。 


(14) ) AEH Rs ett 


ntry_to_ return) ; 


(15) 如 果 这 个 函数 被 调用 时 ，*first_call_ptr 被 设置 为 tue， 就 表 
示 你 需要 从 数据 库 的 起 妨 位 置 开始 搜索 (或 重新 开始 搜索 ) 。 如 果 
first ies 上 sas \ 是 true， 你 只 需 移动 到 数据 库 中 的 FO 关键 字 : 


ocal_data_datum.dptr, 


GSize) ; 


ata catum. 


(16) 搜索 方式 非常 简单 ， 它 只 是 检查 当前 标题 项 是 否 包 含 搜索 字 


符 串 


* check if search string occurs in the entry * 
if (!strstrientry_to_return.catalog, cd_catalog_ptr)) 
{ 
memset ntry_to_return 5 
izeof (entry_to_return)); 
local_key_datum = dbm_nextkey(cdc_dbm_ ptr); 


local data _datum.dptr && 
(entry_to_return.catalog(0) == ‘\0')}; 
return (entry_to_return); 


/* search cdc_entry * 


现在 你 将 通过 下 面 的 makefile 文 件 把 所 有 的 程序 结合 在 一 起 。 现 在 
还 无 顷 太 过 操心 它 ， 因 为 你 马上 束 要 在 下 一 章 中 了 解 它 的 工作 原理 。 目 
nA 需 敲 入 它 的 内 容 并 将 其 保存 为 Makefile 文 件 即 可 : 


application 


INCLUDE=/usr/include/ gdb 

LIBS=gdbm 

# On some di ibutions you may need to change the above line to include 
@ the c cmpatabili ty library, as shown below. 

4 LIBS= -lgdbm compat -igdbm 

CFLAGS= 


g CFLAGS a u 
acce cd_da 
FLA $ (INCLUDE acce 
js ix D .© 
9 $ (CPLA application app acce 
clean: 


rm -é application *.c 


nodbmfi pak 


rm -f 


T 要 想 编 译 这 个 新 的 CD 唱 片 应 用 程序 ， 你 需要 在 提示 符 后 输入 下 面 
命令 : 


$ make 


如 果 一 切 顺 利 ， 可 执行 文件 application 将 被 编译 并 放置 到 当前 目录 


7.5 ”小结 


在 本 章 中 ， 你 学 习 了 数据 管理 的 3 个 方面 知识 。 首 先 ， 你 学 习 了 
Linux 内 存 系 统 的 知识 ， 昌 然 按 需 换 页 虚拟 内 存 的 内 部 实现 非常 复杂 ， 
但 它 的 使 用 还 是 相当 简单 的 。 你 还 学 习 了 它 是 如 何 保护 操作 系统 和 其 他 
进程 免 受 非法 内 存 访 问 侵 害 的 。 

接 下 来 ， 我 们 介绍 了 文件 锁定 功能 是 如 何 允 许多 个 程序 在 访问 数据 
时 协调 工作 的 。 你 首先 看 到 了 一 个 简单 的 二 进 制 信号 量 机 制 。 然 后 是 一 
个 更 复杂 的 情形 ， 即 用 共享 锁 和 独占 锁 来 锁 住 同一 个 文件 的 不 同 部 分 。 
然后 我 们 介绍 了 dbm 库 ， 它 具有 使 用 一 个 非常 灵活 的 索引 布局 来 存储 和 
高 效 地 检索 任意 数据 块 的 能 力 。 
本 
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从 此， 我 们 已 经 探讨 了 使 用 平面 文件 进行 一 些 基本 的 数据 管理 ， 
随后 又 介绍 了 简单 但 却 非 常 快速 的 dbm。 现 在 我 们 将 介绍 一 个 功能 更 齐 
全 的 数据 工具 : RDBMS 或 关系 型 数据 库 管理 系统 (Relational Database 
Management System) 。 

两 个 最 著名 的 开源 RDBMS 应 用 软件 是 PostgreSQL 和 MySQL 。 
PostgreSQL 能 在 任何 情况 下 免费 使 用 。MySQL 尽 管 在 某 些 环境 下 需要 收 
取 许 可 证 费用 ， 但 在 许多 场合 下 它 还 是 免费 的 。 用 于 同一 用 途 的 商业 产 
品 有 Oracle、Sybase 和 DB2， 它 们 都 能 运行 于 多 种 平台 之 上 。 仪 支持 
Windows 平 台 的 微软 SQLServer 是 市 场 上 的 另 一 个 分 文 。 所 有 这 些 产 品 
包 都 有 它们 独特 的 优点 ， 但 由 于 本 书 的 容量 限制 以 及 宣传 开源 软件 的 义 
务 ， 本 书 将 只 专注 于 MySQL。 

MySQL 的 起 源 大 约 要 奶 溯 到 1984 年 ， 但 在 MySQL AB 公 司 的 赞助 之 
下 ，MySQL 用 于 商业 开发 和 管理 已 经 有 许多 年 了 。 虽 然 MySQL 是 开源 
的 ， 但 它 的 使 用 条 球 经 常 与 其 他 的 开源 项 目 发 生 混淆 。 因 此 ， 我 们 有 必 
要 在 这 里 指出 ， 虽 然 它 在 许多 场合 下 的 使 用 是 遵循 GPL 的 ， 但 是 也 有 许 
多 场合 下 你 必须 购买 它 的 商业 许可 证 才能 使 用 它 。 

如 果 你 需要 一 个 开源 数据 库 ， 但 是 又 无 法 接受 在 GPL 之 下 使 用 
MySQL 的 条 球 ， 并 且 你 不 希望 购买 它 的 商业 许可 证 ， 那 么 在 写作 本 书 
的 时 候 ， 因 为 使 用 PostgreSQL 的 许可 证 条 球 不 存在 那么 多 限制 ， 你 或 许 
可 以 考虑 使 用 具备 更 强 功 能 的 PostgreSQL 数 据 库 。 有 关 PostgreSQL 的 更 
多 详细 资料 见 网 址 www.postgresql.org。 


要 了 解 更 多 有 关 PostgreSQL 的 内 容 ， 请 查阅 我 们 的 书籍 
《PostgreSQL: 从 入 门 到 专家 》 (Beginning Databases with 
PostgreSQL: From Novice to Professional) 第 二 版 《Apress, 2005, 
ISBN 1590594789) . 


在 本 章 中 ， 我 们 将 介绍 下 面 一 些 MySQL 主题 : 


安装 MySQL 
必 备 的 MySQL 管 理 命令 
MySQL 的 基本 功能 
从 C 程 序 访问 MySQL 数 据 库 的 API 
ni C 语 言 创 建 一 个 用 于 我 们 的 CD 数据 库 应 用 程序 的 关系 型 数 


$0000 


无 论 你 喜欢 使 用 的 是 哪 种 Linux 套 件 ， 你 的 Linux 套 件 很 可 能 已 提供 
了 预 编译 的 MySQL 版 本 进行 安装 。 例 如 ，Red Hat、SUSE 和 Ubuntu 都 在 
它们 的 当前 发 行 版 中 提供 了 预 编译 的 MySQL 软 件 包 。 一 般 来 说 ， 我 们 
建议 读者 使 用 预 编 译 的 版 本 ， 因 为 它 提供 了 一 种 最 简单 的 快速 建立 并 运 
行 MySQL 的 方法 。 如 果 你 的 发 行 版 未 提供 MySQL 软 件 包 ， 或 者 你 想 使 
ee Se ae enon, 
源 代 人 码 包 。 

在 本 章 中 ， 我 们 只 介绍 如 何 安装 预 编 译 的 MySQL 版 本 。 


8.1.1 MySQL 软件 所 


如 果 你 因 故 需要 下 载 MySQL 而 不 是 使 用 与 Linux 套 件 捆 绑 的 版 本 ， 
对 本 书 而 言 ， 你 应 该 使 用 MySQL 社 区 版 中 的 标准 软件 包 。 你 会 看 到 还 
有 Max 和 Debug 软 件 包 可 以 使 用 。 其 中 Max 软 件 包 包含 一 些 额 外 的 功 
能 ， 如 支持 更 多 不 常见 的 存储 文件 类 型 和 一 些 高 级 功能 (如 和 集群)。 
Debug 软 件 包 在 被 编译 时 包含 了 一 些 额 外 调试 代码 和 信息 ， 希 望 你 不 需 
要 使 用 这 么 底层 的 调试 。 


不 要 在 正规 场合 使 用 Debug 版 本 ， 因 为 额外 的 调试 支持 会 降低 
软件 的 性 能 。 


为 了 开发 MySQL 应 用 程序 ， 你 不 仅 需 要 安装 MySQL 服 务 器 ， 还 需 
要 安装 MySQL 开 发 库 。 通 常情 况 下 ， 软 件 包 管理 器 都 会 有 一 个 MySQL 
选项 ， 你 只 需要 确认 开发 库 已 被 选择 安装 。 在 图 8-1 中 ， 你 可 以 看 到 
Fedora 的 软件 包 管 理 器 选择 了 额外 的 开发 软件 包 以 安装 MySQL。 
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在 其 他 Linux 发 行 版 中 ， 软 件 包 的 安排 可 能 略 有 不 同 。 例 如 ， 网 8-2 
显示 了 Ubuntu 的 synaptic 软 件 包 管理 器 选择 MySQL 软 件 包 的 界面 。 

MySQL 在 安装 时 还 会 创建 用 户 “mysqj”， 访 用户 是 MySQL 服 务 器 守 
护 进 程 运行 时 所 使 用 的 默认 用 户 名 。 | 

在 安装 完 MySQL 软 件 包 之 后 ， 你 需要 检查 MySQL 是 否 已 自动 启动 
了 。 在 写作 本 书 的 时 候 ， 有 坚 Linux 发 行 版 如 Ubuntu 是 这 么 做 的 ， 但 也 
有 一 些 Linux 发 行 版 如 Fedora 没 有 这 么 做 。 和 幸运 的 是 ， 检 查 MySQL 服 务 
器 是 否 正 在 运行 是 一 件 非 常 容易 的 事情 : 

$ps -el | grep mysqld 


installed (local or obsolete! 
installed (upgradable) 


_ 0.064 0.85-r4-2._Nis 


mysql database server (current version) 
This is an empty package that depends on the current “best version of 
mysql-server (currently mysqi-server-5.0), as determined by the MySQL 
maintainers, install this package @ in doubt about which MySQL version 
you want, as thes is the one we conuder to he wn the best chape 


(_Sectens | status) 
Search Resuks | Gustom raers | 
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如 果 你 看 到 有 一 个 或 多 个 mysqld 进 程 正在 运行 ， 那 么 表示 MySQL 
服务 器 已 启动 了 。 在 许多 Linux 系 统 中 ， 你 还 会 看 到 存在 一 个 
safe_ mysqld 进 程 ， 它 是 一 个 以 正确 的 用 户 id 启 动 真 正 的 mysqld 进 程 的 工 
”如 果 需 要 启动 (或 重启 、 停 止 ) MySQL 服 务 器 ， 你 可 以 使 用 GUI 界 
面 的 服务 控制 面板 。Fedora 的 服务 配置 面板 如 图 8-3 所 示 。 
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图 8-3 


你 还 可 以 使 用 服务 配置 编辑 器 ， 来 确定 你 是 否 想 要 MySQL 服 务 器 
在 每 次 Linux 启 动 时 目 动 运行 。 


8.1.2 ”安装 后 的 配置 


假设 一 切 运行 正常 ， 现 在 MySQL 已 经 安装 完成 并 以 默认 选项 集 启 
动 了 了。 下面 让 我 们 来 测试 这 一 假设 是 否 正 确 : 

$ mysql -u root mysql 

如 果 看 到 “Welcome to the MySQL monitor” 信 息 和 一 个 mysql> 提 示 
符 ， 就 表示 服务 器 正在 运行 了 。 当 然 ， 现 在 任何 人 都 能 连接 到 服务 器 并 
拥有 管理 员 权 限 ， 我 们 将 在 稍 后 解决 这 个 问题 。 试 着 输入 \s 来 得 到 更 多 
关于 服务 器 的 信息 。 看 完 后 ， 输 入 quit 或 者 \q 退 出 控制 合 。 

使 用 命令 mysql-? 可 以 获得 更 多 有 关 服 务 器 的 信息 。 在 该 命令 的 输 
出 中 ， 有 一 条 重要 信息 值得 注意 。 在 该 命令 输出 参数 列表 之 后 ， 你 通常 
将 看 到 类 似 Default options are read from the followingfiles in the given 
order: 这 样 的 一 句 话 。 它 告诉 你 在 哪里 可 以 找到 配置 文件 ， 如 有 果 需 要 配 
置 MySQL 服 务 器 ， 你 就 需要 用 到 该 文件 。 配置 文 件 通 常 是 /etc/my.cnf， 


也 有 一 些 发 行 版 〈 如 Ubuntu) 使 用 的 是 /etcmysqlymy.cnf。 

你 也 可 以 使 用 mysqladmin 命 令 来 查看 正在 运行 的 服务 器 状态 : 

$ mysqladmin -u root version 

这 个 命令 的 输出 不 仅 将 确认 服务 器 是 否 正 在 运行 ， 而 且 还 将 告知 正 
在 使 用 的 服务 器 的 版 本 号 。mysqladmin 命 令 还 可 以 借助 使 用 variables 选 
项 检查 一 个 正在 运行 的 服务 器 中 的 所 有 配置 选项 : 

$ mysqladmin variables 

上 面 的 命令 将 输出 一 长 串 变 量 设置 。 其 中 两 个 特别 有 用 的 变量 是 : 
datadir 和 have_innodb， 前 者 告诉 你 MySQL 在 哪里 存储 它 的 数据 ， 后 者 
的 值 通常 是 YES， 表 明 MySQL 服 务 器 文 持 InnoDB 存 储 引 擎 。MySQL 文 
持 好 几 种 存储 引擎 ， 即 用 于 数据 存储 的 底层 实现 程序 。 最 常见 〈 也 是 最 
有 用 ) 的 两 个 存储 引擎 是 mrnoDB 和 MylSAM， 但 也 有 一 些 其 他 的 存储 引 
擎 ， 如 memory 引 擎 ， 它 根本 不 使 用 永久 存储 ， 而 CSV 引 擎 则 使 用 过 号 
分 隅 的 变量 文件 。 不 同 的 引擎 有 痢 不 同 的 功能 和 性 能 。 对 于 通用 数据 库 
来 说 ， 我 们 目前 建议 使 用 InnoDB 存 储 引 擎 ， 因 为 它 在 性 能 和 对 加 强 不 
同 数 据 元 素 之 间 关 系 的 支持 上 取得 了 一 个 很 好 的 折 中 。 如 果 服 务 器 没有 
局 用 对 InnoDB 的 文 持 ， 请 检查 配置 文件 /etcwmy.cnf， 在 skip-innodb 一 行 
的 开头 加 上 # 写 以 注释 掉 该 行 ， 然 后 使 用 服务 编辑 器 重 局 MySQL。 如 果 
这 样 做 不 行 ， 那 么 你 使 用 的 MySQL 版 本 可 能 在 编译 时 没有 包含 InnoDB 
的 支持 。 如 果 这 对 你 很 重要 ， 那 么 请 检查 MySQL 网 站 以 找到 一 个 支持 
InnoDB 的 版 本 。 对 于 本 章 来 说 ， 即 使 你 使 用 的 是 MylSAM 和 存储 引擎 也 没 
有 关系 ， 许 多 发 行 版 默认 使 用 的 就 是 这 个 引擎。 

一 旦 知道 服务 器 二 进 制 代码 中 已 包括 了 对 InnoDB 的 文 持 ， 为 了 将 
其 设置 为 默认 存储 引擎 ， 你 必须 按 如 下 方法 修改 /etcmy.cnf 文 件 ， 人 否则 
服务 器 默认 使 用 的 就 是 MylSAM 引 擎 。 修 改 方法 非常 简单 ， 
在 /etc/my.cnf 文 件 的 mysqld 一 节 中 添加 default-storage-engine=INNODB 一 
行内 容 。 如 下 所 示 文 件 的 开头 : 

[mysqld] 

default-storage-engine=INNOD 

datadir=/var/lib/mysql 


在 本 章 的 剩余 部 分 ， 我 们 假设 默认 的 存储 引擎 已 被 设置 为 
InnoDB. 

在 实际 的 应 用 环 场 中 ， 你 通常 还 会 想 改 变 由 datadir 变 量 设 置 的 默认 
存储 位 置 。 这 也 是 通过 编辑 /etc/my.cnf 配 置 文件 中 的 mysqld 一 节 来 完成 
的 。 例 如 ， 如 果 你 使 用 的 是 ImnnoDB 存 储 引 擎 ， 准 备 将 数据 文件 放 
在 /Vvo102 目 录 中 ， 将 日 志文 件 放 在 /vo103 目 录 中 ， 设 置 数据 文件 的 初始 


大 小 为 10M， 并 允许 它 目 扩充 ， 你 可 以 使 用 如 下 的 配置 行 : 
innodb_data_home_dir = /vo102/mysql/data 
innodb_data_file_path = ibdatal:10M:autoextend 
innodb_log_group_home_dir = /vo103/mysql/logs 
你 可 以 在 www.mysql.com 网 站 上 的 在 线 手册 中 了 解 更 多 信息 。 


如 果 服 务 咒 不 能 有 局 动 或 服务 器 启动 后 你 无 法 连接 到 数据 库 ， 请 
阅读 下 一 节 来 诊断 安装 中 的 问题 。 


好 的 ， 还 记得 之 前 我 们 提 到 的 那个 巨大 的 安全 漏洞 吗 ? 它 允 许 任何 
人 以 root 用 户 喘 份 进行 连接 而 不 需要 输入 密码 。 现 在 是 时 候 提 高 服务 器 
的 安全 性 了 。 你 千 万 不 要 被 MySQL 安 装 中 所 使 用 的 root 用 户 名 搞 糊 涂 
了 ，MySQL 的 root 用 户 和 系统 的 root 用 户 训 无 关系 。MySQL 只 不 过 默认 
使 用 一 个 称 为 “root” 的 用 户 作为 管理 用 户 ， 就 像 Linux 操 作 系 统一 样 。 
MySQL 数 据 库 的 用 户 和 Linux 系 统 的 用 户 ID 没有 关系 ，MySQL 有 它 目 己 
的 内 置 用 户 和 权限 管理 。 在 默认 情况 下 ， 只 要 在 Linux 系 统 中 有 账号 的 
用 户 都 可 以 以 MySQL 省 理 员 的 映 份 登录 进 MySQL 服 务 占 。 一 旦 你 收 紧 
了 MySQL 中 root 用 户 的 权限 ， 如 只 允许 本 地 用 户 以 root 用 户 喘 份 登录 并 
设置 了 访问 黎 码 ， 你 就 可 以 只 添加 对 你 的 应 用 程序 正音 工作 绝对 必要 的 
用 户 和 权限 了 。 

有 很 多 设 定 root 用 户 密 码 的 方法 ， 最 简单 的 方法 是 使 用 如 下 命令 : 

$ mysqladmin -u root password newpassword 

这 将 设 定 初 始 密 码 为 newpassword。 

但 是 ， 这 个 方法 会 引发 问题 ， 因 为 明文 密码 将 会 留 在 shell 的 历史 记 
录 中 ， 并 且 当 命令 正在 执行 时 ， 其 他 人 可 以 使 用 ps 命令 看 到 该 密码 ， 或 
者 通过 你 的 命令 历史 记录 重 现 该 密码 。 一 个 更 好 的 方法 是 再 次 使 用 
MySQL 控 制 台 ， 这 次 是 发 送 一 些 SQL 语 句 来 修改 你 的 密码 。 

$ mysql -u root 

Welcome to the MySQL monitor. Commands end with; or \g. 

Your MySQL connection id is 4 


Type ‘help;’ or ‘\h’ for help. Type ‘\c’ to clear the buffer. 


mysql> SET password=PASSWORD (‘secretpassword’); 
Query OK, 0 rows affected (0.00 sec) 
当然 ， 你 需要 选择 一 个 只 有 你 自己 知道 的 密码 ， 而 不 是 例子 中 
的 “secretpassword”， 这 个 密码 只 是 用 来 显示 你 自己 的 密码 应 该 输入 的 位 


置 。 如 果 你 又 想 要 删除 这 个 密码 ， 你 只 需 用 一 个 空 字符 囊 代 
#“secretpassword” Al! HJ 。 


请 注意 ， 我 们 使 用 一 个 分 号 G ) 来 结束 SQL 命令 。 严 格 来 
说 ， 分 号 并 不 是 实际 SQL 命令 的 一 部 分 ， 它 只 是 告诉 MySQL 客 户 端 
程序 我 们 的 SQL 语句 已 准备 好 被 执行 了 。 我 们 还 为 SQL 关键 字 使 用 
了 大 写字 母 ， 如 SET。 这 并 不 是 必需 的 ， 因 为 实际 的 MySQL 语 法 人 允 
许 关 键 字 使 用 大 写 或 小 写字 母 ， 但 我 们 在 本 书 中 以 及 在 日 常 的 工作 
中 都 习惯 于 使 用 大 写 的 关键 字 ， 因 为 这 样 会 使 得 SQL 语句 更 容易 阅 


读 。 


现在 检查 一 下 权限 表 以 确认 密码 已 被 设置 。 首 先 使 用 use 命 令 切 换 
到 mysql 数 据 库 ， 然 后 查询 内 部 表 : 


mysql 
mysq SELECT user, host, password FROM user; 


注意 观察 ， 我 们 为 从 localhost 建 立 连 接 的 root 用 户 创建 了 一 个 密 
码 。MySQL 不 仅 能 为 用 户 保存 不 同 的 权限 ， 也 能 为 基于 主机 名 的 连接 
类 保存 不 同 的 特权 。 确 保安 装 安全 的 下 一 步 将 是 去 除 那 些 由 MySQL 默 
认 安 装 的 不 需要 的 用 户 。 下 面 的 命令 将 会 从 权限 表 中 删除 所 有 非 root 用 
F: 

mysql> DELETE FROM user WHERE user != ‘root’; 

Query OK, 2 rows affected (0.01 sec) 

下 一 条 命令 将 删除 从 localhost 以 外 的 任何 主机 的 登录 : 

mysql> DELETE FROM user WHERE host != ‘localhost’ ; 

Query OK, 1 row affected (0.01 sec) 

最 后 ， 使 用 如 下 命令 来 检查 是 否 还 有 遗漏 的 登录 1: 


mysq SELECT user, host, password FROM user; 


从 上 面 的 输出 可 以 看 出 ， 我 们 现在 只 有 一 个 仅 能 从 localhost 连 接 的 


Fa 

现在 是 验证 事实 的 时 刻 了 : 我 们 仍 能 使 用 设 定 的 密码 来 登录 吗 ? 注 
， 这 次 我 们 给 出 -p 参 数 ， 它 要 求 MySQL 必 须 给 出 询问 密码 的 提示 : 

$ mysql -u root -p 

Enter password: 

Welcome to the MySQL monitor. Commands end with ; or \g. 

Your MySQL connection id is 7 


as 


Eat 


Type ‘help;’ or ‘\h’ for help. Type ‘\c’ to clear the buffer. 


mysql> 

现在 ， 我 们 有 了 一 个 正在 运行 的 MySQL 版 本 ， 它 已 经 被 限制 为 只 
有 使 用 我 们 设 定 密码 的 root 用 户 才能 连接 到 数据 库 服务 器 ， 并 且 这 个 
root 用 户 只 能 从 本 地 机 器 连接 。 我 们 还 可 以 在 命令 行 上 提供 密码 以 连接 
到 MySQL。 你 可 以 使 用 参数 --password， 如 --password=secretpassword， 
或 使 用 -psecretpassword， 但 显然 这 是 不 太 安 全 的 ， 因 为 密码 可 能 被 ps 命 
令 或 通过 命令 历史 记录 看 到 。 然 而 ， 如 果 你 正在 编写 一 个 需要 连接 到 
MySQL 的 脚本 ， 那 么 在 命令 行 上 提供 密码 义 是 必要 的 。 

下 一 步 是 添加 需要 的 用 户 。 对 于 Linux 系 统 来 说 ， 除 非 绝 对 必需 ， 
否则 最 好 使 用 root 账 号 来 登录 MySQL， 所 以 你 应 该 为 日 常 使 用 创建 一 个 
普通 用 户 。 

正如 我 们 之 前 提示 的 ， 你 可 以 针对 不 同 的 机 器 来 创建 用 户 ， 并 给 他 
们 分 配 不 同 的 连接 权限 。 特 别 地 ， 出 于 安全 考虑 ， 我 们 只 人 允许 root 用 户 
通过 本 地 机 器 连接 。 在 本 章 中 ， 我 们 将 创建 一 个 拥有 相当 广泛 权限 的 新 
用 户 rick。rick 将 能 使 用 3 种 不 同 的 方法 进行 连接 。 

O 从 本 地 机 器 连接 。 

O “从 人 地 址 在 192.168.0.0 一 192.168.0.255 范 围 内 的 任何 机 器 连接 。 

O 从 wiley.com 域 中 的 任何 机 器 连接 。 

最 安全 最 简单 的 方法 是 创建 3 个 不 同 的 用 户 ， 他 们 分 别 从 3 个 不 同 的 
地 点 进行 连接 。 如 果 愿 意 ， 我 们 甚至 可 以 根据 他 们 从 何 处 连接 给 他 们 分 
别 设置 3 个 不 同 的 密码 。 

我 们 通过 使 用 grant 命 令 来 创建 用 户 并 赋予 权限 。 这 里 ， 我 们 使 用 上 
面 列 出 的 3 个 不 同 的 连接 起 点 来 创建 用 户 。IDENTIFIED BY 是 一 个 有 点 
古怪 的 设 定 初 始 密码 的 语法 。 请 注意 引号 的 使 用 方法 ， 如 下 面 显示 的 那 
人 否则 我 们 将 不 能 按照 我 们 期 望 的 那样 创 
建 用 户 。 


以 root 用 户 身 份 连接 到 MySQL， 然 后 依次 执行 如 下 操作 。 
(1) 为 rick 创 建 一 个 本 地 登录 : 


l GRANT ALL ON *.* TO rick@localhost IDENTIFIED BY ‘secretpassword'; 


(2) 然后 创建 一 个 来 自 C 类 子 网 192.168.0 的 登录 。 注 意 ， 我 们 必须 
用 单 引 号 来 保护 IP 范 围 ， 并 使 用 掩 码 /255.255.255.0 来 确定 允许 的 IP 地 址 
范围 : 

Query OK, 0 rows affected (0.00 sec) 

(3) 最后， 创建 一 个 登录 ， 让 rick 能 从 wiley.com 域 中 的 任何 机 器 
登录 (同样 也 需要 注意 单 引 号 的 使 用 ) : 


1l> GRANT ALL ON *.* TO rick@'%.wiley.com' IDENTIFIED BY 'secretpassword'; 


(4) 现在 我 们 再 次 查看 user 表 来 核对 条 目 : 


当然 ， 你 需要 调整 上 面 的 命令 和 密码 来 适应 你 的 本 地 配置 。 你 将 注 
意 到 ， 我 们 使 用 的 是 GRANT ALLON *.* 命 令 ， 正 如 你 可 能 猜测 的 那 
样 ， 这 给 了 用 户 rick 非 常 广 泛 的 权限 。 对 于 权力 很 大 的 用 户 这 样 做 当然 
很 好 ， 但 是 对 于 创建 受 限 用 户 就 不 适用 了 。 我 们 将 在 本 章 的 8.2.2 节 中 更 
详细 地 介绍 grant 命 令 。 在 那里 ， 我 们 将 讲解 如 何 创建 一 个 受 限 用 户 。 

至 此 我 们 已 经 安装 并 运行 了 MySQL (如 果 还 没有 ， 请 阅读 下 一 
节 ) ， 提 高 了 服务 器 的 安全 性 ， 并 且 创 建 了 一 个 非 root 用 户 来 准备 完成 
一 些 工作 。 接 下 来 我 们 将 首先 讨论 安装 后 的 故障 修复 ， 然 后 回 过 头 来 快 
速 地 浏览 一 下 MySQL 数 据 库 管理 的 要 素 。 


8.1.3 #2 故障 修 
如 果 使 用 mysql 进 行 连接 失败 ， 你 可 以 使 用 系统 的 ps 命令 来 检查 服 


务 名 进程 是 否 正在 运行 。 如 末 不 能 在 ps 命令 的 输出 列表 中 找到 它 ， 则 可 
以 答 试 执行 命令 mysql_safed-log。 它 会 将 一 些 额外 信息 写 入 位 于 MySQL 


H&A PSC. MAW SAAB a mysqldvtte, thay LAH tS 
mysqld--ver-bose--help 以 获得 完整 的 命令 行 选项 列表 。 

也 有 可 能 是 服务 器 正在 运行 ， 但 却 拒绝 了 你 的 连接 。 如 果 是 这 样 ， 
下 一 个 需要 检查 的 就 是 数据 库 是 否 存 在 ， 特 别 是 默认 的 MySQL 权 限 数 
据 库 是 否 存在 。Red Hat 发 行 版 通常 默认 使 用 的 数据 库 目 录 
是 /var/lib/mysql， 但 其 他 发 行 版 可 能 使 用 不 同 的 目录 位 置 。 请 检查 
MySQL 的 启动 脚本 《〈 例 如 ， 在 /etcinit.d 目 录 中 ) 和 配置 文件 /etc/my.cnf 
来 找到 数据 库 目 录 位 置 ， 你 也 可 以 使 用 mysqld-verbose -help 命 令 直 接 调 
用 mysqld 程 序 ， 并 碍 找 命令 输出 中 的 变量 datadir 来 找到 数据 库 目 录 位 
置 。 一 旦 你 找到 了 数据 库 目 录 ， 请 确认 它 至 少 包 含 一 个 默认 的 权限 数据 
库 〈 称 为 mnysdl) ， 并 且 服 务 器 守护 进程 正在 使 用 这 个 位 置 (通过 文件 
my.cnf 来 指定 ) 。 

如 果 你 还 是 无 法 连接 ， 请 使 用 服务 编辑 器 停止 服务 器 ， 检 查 并 确认 
己 没 有 mysqld 进 程 正在 运行 ， 然 后 重启 服务 器 并 再 次 尝试 连接 。 如 果 这 
样 做 你 还 是 无 法 连接 ， 你 可 以 尝试 完全 秃 载 MySQL 并 重新 安装 它 。 
MySQL 网 站 上 的 MySQL 文 档 也 是 非常 有 用 的 资源 〈 它 总 是 比 本 地 的 手 
册页 要 新 ， 而 且 它 还 会 包含 一 些 用 户 编辑 的 提示 和 建议 以 及 一 个 论 
坛 ) ， 你 可 以 通常 浏览 该 文档 来 找到 一 些 更 深层 次 的 信息 。 


8.2 MySQL‘ F 


包含 在 MySQL 发 行 版 中 的 一 些 有 用 的 工具 程序 使 管理 工作 变 得 相 
当 容易 。 它 们 中 最 常用 的 是 mysgladmin 程 序 。 我 们 将 在 本 节 中 介绍 这 个 
程序 以 及 其 他 一 些 工 具 。 


8.2.1 命令 


除 mysqlshow 命 令 以 外 ， 所 有 的 MySQL 命 令 都 接受 表 8-1 所 示 的 3 个 
标准 参数 。 


我 们 再 次 建议 你 不 要 把 密码 放 在 命令 行 上 ， 因 为 它 可 以 被 ps 命 


令 看 到 。 


1. myisamchk 命 令 


myisamchk 工 具 是 设计 用 来 检查 和 修复 使 用 ee 
任何 数据 表 ，MYISAM 表 格式 由 MySQL 自 身 支 持 。 通 常情 况 下 ， 
myisamchk 应 该 以 安装 时 创建 的 mysql 用 户 号 份 来 运行 ， 并 且 运 行 该 全 命令 
时 应 该 位 于 数据 表 所 处 的 目录 中 。 为 了 检查 数据 库 ， 首 先 执行 命令 su 
mysql， 然 后 改变 目录 到 与 数据 库 名 称 对 应 的 目录 下 ， 使 用 表 8-2 中 推荐 
的 一 个 或 多 个 选项 来 运行 myisamchk。 例 如 : 

Reet -e -r *.MYI 

myisamchk 最 常见 的 命令 选项 见 表 8-2。 


表 8-2 


ry PT 


为 获得 更 多 信息 ， 我 们 可 以 不 带 任 何 参 数 的 调用 myisamchk 命 令 以 
查看 更 多 的 帮助 信息 。 这 个 工具 对 InnoDB 类 型 的 数据 表 没 有 效果 。 


2. mysql 命 令 


这 是 MySQL 一 个 主要 的 且 功 能 非常 强大 的 命令 行 工具 。 几 乎 每 个 
管理 或 用 户 级 别 的 任务 都 可 以 在 这 里 执行 。 你 可 以 从 命令 行 启动 
mysql， 通 过 在 命令 行 的 最 后 添加 数据 库 名 称 作为 参数 ， 你 就 无 需 在 
MySQL 的 控制 台中 使 用 use <database> 命 令 。 例 如 ， 以 用 户 名 rick、 提 示 
输入 密码 〈 注 意 -p 参 数 后 面 有 一 个 空格 ) 、 默 认 使 用 数据 库 foo 来 启动 控 
制 台 的 命令 如 下 所 示 : 

$ mysql -u rick -p foo 

你 可 以 使 用 mysql -help | less 命 令 来 逐 页 查看 mysql 控 制 台 的 其 他 命 
令 行 选项 列表 。 

如 果 在 启动 MySQL 时 未 指定 数据 库 ， 你 可 以 在 MySQL 中 使 用 use 
<databasename> 选 项 来 选择 一 个 数据 库 ， 正 如 表 8-3 的 命令 列表 显示 的 那 
样 


另外 ， 你 还 可 以 通过 非 交 互 模式 来 运行 mysqdl， 只 需 捆 绑 命令 到 一 
个 输入 文件 中 并 从 命令 行 读 取 它 即 可 。 在 这 种 情况 下 ， 你 必须 在 命令 行 
上 指定 密码 : 

$ mysql -u rick --password=secretpassword foo < sqlcommands.sql 

一 旦 mysqdl 读 取 并 处 理 完 命令 ， 它 就 将 返回 到 命令 提示 人 符 。 

当 mysql 客 户 病 连接 到 服务 器 后 ， 除 了 标准 的 SQL92 命 令 集 以 外 ， 
还 有 一 些 特定 的 命令 也 会 被 mysqdl 文 持 ， 如 表 8-3 所 示 。 


表 8-3 
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这 个 命令 集中 一 个 非常 重要 的 命令 是 use。mysqld 服 务 絮 支持 同时 
拥有 许多 不 同 的 数据 库 这 一 想法 ， 所 有 的 数据 库 都 由 同一 个 服务 器 进程 
来 服务 和 管理 。 许 多 其 他 数据 库 服务 器 ， 如 Oracle 和 Sybase， 使 用 术语 
schema (7738) ， 而 MySQL 最 经 单 使 用 的 术语 是 database (MySQL 
询 浏 览 器 使 用 的 是 术语 schema) 。 每 个 数据 库 〈 在 MySQL 的 术语 中 ) 
都 是 一 个 基本 独立 的 表格 集 。 这 使 得 你 可 以 针对 不 同 的 目的 建立 不 同 的 
数据 库 ， 并 为 每 个 数据 库 指定 不 同 的 用 户 ， 而 只 需要 使 用 同一 个 数据 库 
服务 器 就 可 以 有 效 地 管理 它们 了 。 只 要 拥有 适当 的 权限 ， 你 就 可 以 通过 
使 用 use 命 令 在 不 同 的 数据 库 之 间 进 行 切换 。 

特定 数据 库 mysql 是 由 MySQL 安 装 目 动 创建 的 ， 它 用 于 保存 如 用 户 
和 权限 这 样 的 数据 。 


SQL92 是 使 用 最 广泛 的 一 个 ANSI “SQL 标准 版 本 。 它 为 SQL 数 
式 、 不 同 数据 库 产 品 之 间 的 互 操 作 和 通信 创建 一 致 的 
示 准 。 

3. mysqladmin 


这 是 快速 进行 MySQL 数 据 库 管理 的 主要 工具 。 除 了 常见 的 参数 以 
外 ， 它 还 支持 如 表 8-4 所 示 的 命令 。 


表 8-4 


如 果 不 带 参 数 调用 mysqladmin 命 令 ， 我 们 就 可 以 从 命令 提示 符 下 看 
到 完整 的 选项 列表 。 你 也 许 想 使 用 |less 来 分 页 显示 。 


4. mysqlbug 
如 打 运 气 好 的 话 ， 你 将 不 会 有 机 会 使 用 这 个 命令 。 顾 名 思 义 ， 这 个 


工具 生成 一 个 用 于 发 送 给 MySQL 维 护 者 的 错误 报告 。 在 发 送 它 之 前 ， 
你 可 能 希望 编辑 生成 的 文件 以 提供 对 开发 者 可 能 有 用 的 其 他 信息 。 


5. mysqldump 


这 是 一 个 极其 有 用 的 工具 ， 它 允许 你 以 SQL 命令 集 的 形式 将 部 分 或 
整个 数据 库 导 出 到 一 个 单独 文件 中 ， 该 文件 能 被 重新 导入 MySQL 或 其 
他 的 SQL RDBMS。 它 接受 标准 用 户 和 密码 信息 作为 参数 ， 也 接受 数据 
oe rene: 表 8-5 中 列 出 的 其 他 选项 大 大 扩展 了 这 个 工具 的 
功能 。 


只 转 储 表 中 的 数据 ， 和 而 不 是 用 来 创建 表 的 信息 
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默认 情况 下 ，mysqldump 将 数据 发 送 到 标准 输出 ， 而 你 一 般 都 是 希 
望 把 它 重 定 问 到 文件 。 

这 个 工具 对 于 迁移 数据 或 快速 备份 非常 有 用 。 此 外 ， 由 于 MySQL 
的 客户 端 服务 器 实现 方式 ， 通 过 使 用 一 个 安装 在 不 同 机 器 上 的 
mysqldump 客 户 端 ， 它 甚至 可 以 用 来 实现 远程 备份 。 下 面 这 个 例子 显示 
了 通过 用 户 名 rick 进 行 连 接 ， 转 储 数 据 库 myplaydb 的 例子 : 


$ mysqldump -u rick -p myplaydb > myplaydb.dump 


在 我 们 的 系统 上 ，myplaydb 数 据 库 中 只 有 一 个 表 ， 结 果 文 件 如 下 所 


示 


6. mysqlimport 


mysqlimport 命 令 用 于 批量 将 数据 导入 到 一 个 表 中 。 通 过 使 用 
mysqlimport， 你 可 以 从 一 个 输入 文件 中 读 取 大 量 的 文本 数据 。 这 个 命令 
唯一 的 参数 需求 是 一 个 文件 名 和 一 个 数据 库 名 。mysqlimport 将 把 数据 导 
入 到 数据 库 中 与 文件 名 不 包括 任何 文件 扩展 名 〉 相同 的 表 中 。 你 必须 
确认 文本 文件 与 将 要 填 入 数据 的 表 拥 有 相同 的 列 数 ， 并 且 数 据 类 型 是 兼 
容 的 。 在 默认 情况 下 ， 数 据 应 以 tab 分 隔 符 分 开 。 正 如 我 们 前 面 提 到 的 
那样 ， 我 们 也 可 以 通过 一 个 文本 文件 来 执行 SQL 命令 ， 只 需 运 行 mysql 
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， 并 将 输入 重 定 问 到 一 个 文件 即 可 。 

7. mysqlshow 

这 个 小 工具 能 够 让 你 快速 了 解 MySQL 安 装 及 其 组 成 数据 库 的 信 
不 提供 参数 ， 它 列 出 所 有 可 用 的 数据 库 。 

以 一 个 数据 库 为 参数 ， 它 列 出 该 数据 库 中 的 表 。 


以 数据 库 和 表 名 为 参数 ， 它 列 出 表 中 的 列 。 
以 数据 库 、 表 和 列 为 参数 ， 它 列 出 指定 列 的 详细 信息 。 


OOOO 


8.2.2 创建 用 户 并 赋予 权限 


作为 MySQL 管 理 员 ， 最 常见 的 工作 就 是 维护 用 户 信 息 一 一 在 


MySQL 中 添加 和 删除 用 户 并 管理 他 们 的 权限 。 从 MySQL 3.22 开 始 ， 我 
们 可 以 通过 在 MySQL 控 制 台 中 使 用 grant 和 revoke 命 令 来 管理 用 户 权限 


与 在 以 前 版 本 中 必须 通过 直接 编辑 特权 表 来 管理 用 户 相 比 ， 这 项 任 


务 变 得 轻松 了 很 多 。 


格 。 


1. grant 


MySQL 的 grant 命 令 几乎 完全 遵循 SQL92 的 语法 ， 尽 管 不 是 非常 严 
它 的 常规 格式 是 : 


r {identified by user-passworc) ~ 


可 以 授予 的 特权 值 如 表 8-6 所 示 。 


以 上 了 所 有 


一 些 命 令 还 有 其 他 选项 。 例 如 ，create view 授 予 用 户 创建 视图 的 权 


限 。 要 想 了 解 最 权威 的 权限 列表 ， 请 查阅 MySQL 版 本 的 文档 ， 因 为 每 
一 个 新 的 MySQL 版 本 都 会 对 这 一 领域 进行 扩展 。 还 有 一 些 特殊 的 管理 
权限 ， 但 我 们 在 这 里 并 不 关注 它们 。 

授予 特权 的 对 象 被 标识 为 : 

databasename.tablename 
在 Linux 传 统 中 ，* 代 表 的 是 通配符 ， 因 此 *.* 代 表 每 个 数据 库 中 的 每 个 对 
象 ， 而 foo.* 代 表 数 据 库 foo 中 的 每 个 表 。 

如 果 指 定 的 用 户 已 经 存在 ， 他 的 特权 会 被 编辑 以 反映 你 所 做 的 修 
改 。 如 果 该 用 户 不 存在 ， 他 就 会 以 指定 的 特权 被 创建 。 正 如 你 前 面 看 到 
的 那样 ， 用 户 可 以 被 指定 为 来 自 某 个 特定 的 主机 。 你 应 该 在 同一 个 命令 
中 同时 指定 用 户 和 主机 ， 以 便 灵活 获得 MySQL 权 限 配置 。 

在 SQL 语法 中 ， 特 殊 字 符 % 代 表 通 配 符 ， 它 与 shell 环 境 中 * 号 的 作用 
完全 一 样 。 你 当然 可 以 为 每 个 期 望 的 特权 使 用 单独 的 命令 ， 但 是 如 果 你 
予 用 户 rick 从 wiley.com 域 中 任何 主机 访问 的 权限 ， 可 以 把 rick 摘 述 


rick@ ‘%.wiley.com’ 


任何 时 候 使 用 % 通 配 符 都 必须 把 它 放 在 引号 中 ， 以 与 其 他 文本 分 


你 还 可 以 使 用 IP/ 网 络 掩 码 标识 CN.N.N.N/M.M.M.M) 来 为 访问 控 
制 设置 一 个 网 络 地 址 。 

正如 我 们 之 前 使 用 rick@“ 192.168.0.0/255.255.255.0’ 来 授予 ick 从 本 
地 网 络 中 任何 机 器 连接 的 特权 那样 ， 我 们 也 可 以 指定 
rick@'192.168.0.1’ 来 将 rick 的 访问 限制 到 一 台 工 作 站 ， 或 指定 rick@ 
‘192.0.0.0/255.0.0.0’ 来 扩大 范围 以 包括 192 这 个 A 类 网 络 中 的 所 有 机 器 。 

下 面 是 另外 一 个 例子 : 

mysql> GRANT ALL ON foo.* TO rick@ ‘ %’ IDENTIFIED BY 
‘bar’; 
这 将 创建 用 户 rick， 他 拥有 对 数据 库 foo 的 所 有 权限 ， 并 能 以 初始 密码 bar 
从 任何 机 器 进行 连接 。 

如 果 数 据 库 foo 尚 未 存在 ， 那 么 用 户 rick 现 在 将 拥有 使 用 SQL 命令 
create database 来 创建 该 数据 库 的 权限 。 

IDENTIFIED BY 子 句 是 可 选 的 ， 但 在 创建 用 户 的 同时 最 好 确保 他 们 
都 设置 有 密码 。 

你 需要 格外 小 心 在 用 户 名 、 主 机 名 或 数据 库 名 中 包含 下 划 线 的 情 
况 ， 因 为 SQL 中 的 下 划 线 是 一 种 匹配 任意 单个 字符 的 模式 ， 这 与 % 匹 配 
一 个 字符 串 非 常 类 似 。 因 此 只 要 有 可 能 ， 请 尽量 不 要 在 用 户 名 和 数据 库 
名 中 包含 下 划 线 。 


一 般 来 说 ，with grant option 只 会 用 于 创建 二 级 管理 员 。 但 是 ， 它 也 
可 以 用 于 允许 一 个 新 创建 的 用 户 将 授予 他 的 特权 赠 予 其 他 用 户 。 所 以 请 
始终 谨慎 地 使 用 with grant option. 


2. revoke 命 令 


当然 ， 管 理 员 不 仅 可 以 授予 用 户 权 限 ， 同 样 也 能 够 剥夺 用 户 权 限 。 
这 是 通过 revoke 命 令 来 完成 的 : 

revoke <a_privilege> on <an_object> from <a_user> 

这 与 grant 命 令 的 格式 极其 相似 。 例 如 ， 

mysql> REVOKE INSERT ON foo.* FROM rick@‘%’; 

但 是 ，revoke 命 令 不 能 删除 用 户 。 如 果 想 要 完全 删除 一 个 用 户 ， 不 
要 只 是 修改 他 们 的 权限 ， 而 应 用 revoke 来 删除 他 们 的 权限 。 然 后 ， 你 就 
可 以 切换 到 内 部 的 mysql 数 据 库 ， 通 过 从 user 表 中 删除 相应 的 行 来 完全 删 

mysql> use mysql 

mysql> DELETE FROM user WHERE user = “rick” 

mysql> FLUSH PRIVILEGES; 

因为 未 指定 主机 ， 所 以 我 们 就 可 以 确保 删除 了 我 们 想 要 删除 的 
MySQL 用 户 《 在 本 例 中 是 rick) 的 每 个 实例 。 在 完成 了 这 个 之 后 ， 请 一 
定 要 返回 你 自己 的 数据 库 ( 使 用 use 命 令 ) ， 否 则 你 仍然 在 MySQL 自己 
的 内 部 数据 库 中 。 


请 理解 delete 与 grant 和 revoke 并 不 属于 同一 范畴 。 由 于 MySQL 
处 理 权 限 方式 的 需要 ， 这 里 的 SQL 语法 是 必需 的 。 你 是 通过 直接 更 
ae (因此 首先 调用 命令 use mysql) 来 有 效 地 完成 
BAKI. 

在 更 新 表 之 后 ， 你 必须 使 用 命令 FLUSH = PRIVILEGESK VF 
MySQL 服 务 器 ， 它 需要 重 载 它 的 权限 表 ， 正 如 上 面 例子 中 显示 的 
那样 。 


8.2.3 ”密码 


如 果 想 为 尚未 拥有 密码 的 用 户 指 定 密 码 ， 或 者 希望 改变 目 己 或 别人 
的 密码 ， 你 就 需要 以 root 用 户 里 份 连接 到 MySQL 服 务 嚣 ， 人 然后 直接 更 新 
用 户 信息 。 例 如 : 

mysql> use mysql 

mysql> SELECT host, user, password FROM user; 


你 会 得 全 _ 列表， 


+ 一 一 一 一 一 一 一 一 一 一 一 十 一 一 一 一 -一 一 一 一 一 $------------------ + 
| host | user | password 

二 一 一 一 一 一 一 一 一 一 一 一 二 一 一 一 一 一 一 一 一 一 一 二 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
| localhost | root | 67457e226alal5bd | 
| localhost | foo | | 
+ 一 一 一 一 一 一 一 一 一 一 一 $+---------- + 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 + 


2 rows in set (0.00 sec) 

如 果 想 给 用 户 foo 指 定 密码 bar， 则 可 以 这 样 做 : 

mysql> UPDATE user SET password = password (‘bar’) WHERE 
user = ‘foo’; 


再 次 显示 user 表 中 的 相关 列 : 


mysql> SELECT host, user, password FROM user; 


本 一 一 一 一 一 一 一 一 一 一 一 大 一 一 一 一 一 一 一 一 一 本 


一 一 一 大 二 


pp T 用 户 foo 现 在 有 一 个 密码 了 。 请 不 要 忘记 返回 你 原先 的 数 
JEJE 。 

从 MySQL 4.1 开 始 ， 密 码 机 制 已 经 被 更 新 过 了 。 但 是 ， 考 上 处 到 向 后 
往 ， 你 仍然 可 以 使 用 函数 OLD_PASSWORD (‘要 设置 的 密码 *) 来 
通过 老 的 算法 设 定 密码 。 


8.2.4 创建 数据 库 


下 一 步 工作 就 是 创建 数据 库 。 假 设 你 想 要 一 个 名 为 rick 的 数据 库 ， 
还 记得 你 已 用 同样 的 名 字 创 建 了 一 个 有 用户。 首先， 需要 授予 用 户 rick 广 
泛 的 权限 以 允许 他 创建 新 的 数据 库 。 这 样 做 对 一 个 开发 系统 尤其 有 用 ， 
因为 它 可 以 让 用 户 有 更 大 的 灵活 性 。 

mysql> GRANT ALL ON *.* TO rick@localhost IDENTIFIED BY 
‘secretpassword’; 

MÆ rick A A tr ae FF EI FER UTA IR i E.: 

$ mysql -u rick -p 

Enter password: 


mysql> CREATE DATABASE rick; 

Query OK, 1 row affected (0.01 sec) 

mysql> 

告诉 MySQL 我 们 想 使 用 新 的 数据 库 : 

mysql> use rick 

现在 ， 你 可 以 向 数据 库 中 添加 你 想 要 的 表 和 信息 了 。 在 以 后 的 登录 
中 ， 你 可 以 在 命令 行 的 结尾 指定 数据 库 ， 而 不 需要 再 使 用 use 命 令 了 : 

$ mysql -u rick -p rick 

在 按照 提示 输入 密码 之 后 ， 作 为 连接 过 程 的 一 部 分 ， 在 默认 情况 
下 ， 你 将 目 动 切换 到 使 用 数据 库 rick。 


8.2.5 ”数据 类 型 


现在 ， 你 有 了 一 个 可 以 运行 的 MySQL 服 务 器 、 一 个 安全 的 用 户 登 
录 和 一 个 准备 好 使 用 的 数据 库 。 接 下 来 需要 做 什么 呢 ? 你 需要 创建 一 些 
包含 列 的 表 来 保存 数据 。 但 是 ， 在 此 之 前 ， 你 需要 了 解 MySQL 支 持 的 
数据 类 型 。 

MySQL 的 数据 类 型 非常 标准 ， 因 此 在 这 里 我 们 将 仅仅 简要 地 浏览 
主要 的 类 型 。 一 如 往常 ，MySQL 网 站 上 的 MySQL 手 册 对 此 进行 了 更 为 
详细 的 讨论 。 


1. 布尔 类 型 


可 以 用 关键 字 BOOL 来 定义 布尔 列 。 正 如 你 所 期 望 的 那样 ， 它 将 持 
有 TRUE 和 FALSE 值 。 它 也 可 以 持 有 特殊 的 数据 库 “ 未 知 ” 值 NULL。 


2. 字符 类 型 
如 表 8-7 所 示 ， 有 多 种 字符 类 型 可 供 选 择 。 前 3 个 是 标准 的 ， 后 3 个 


是 MySQL 特 有 的 。 我 们 建议 在 满足 实际 使 用 要 求 的 前 提 下 ， 尺 量 坚持 
使 用 标准 类 型 。 


表 8-7 


z X 说 M 


CHAR 单 学 符 
{AR UN} 正好 有 NN 个 字符 的 字符 刺 ， 如 时 必要 会 以 空格 字符 填充 。 限 制 为 255 个 字符 
RCHAR (N} N 个 字符 的 可 变 长 数组 。 限 制 为 244 个 字符 
TEX MLF VARCHAR IN 


ME NGS 5S35 个 字符 的 文本 字符 出 
LONGTEXT REA- AERALA 


3. 数值 类 型 
数值 类 型 分 为 整 型 和 浮 点 型 ， 如 表 8-8 所 示 。 
表 8-8 


= oo 类 型 说 M 
TI "TE 8 位 数据 类 型 
SMALLINT eae 160 RE 
MEDIUMIN’ yy 24 MRA 
INT mM 32 位 数据 类 型 。 这 是 标准 类 型， 对 于 一 般 使 用 是 很 好 的 选择 

INT ny OATES MR 

FLOAT (P) FA 精度 至 少 为 ?位 数学 的 浮 点 数 
DOUBLE (D, N IPM TTT RUM A, FARCE Rin 
NUMERIC (P,S uN BEAPHAR, DRAEZ. nouse rA, AEA 


AMR, ASAE, PERRE 


一 般 情况 下 ， 我 们 建议 你 坚持 使 用 INT、DOUBLE 和 NUMERIC 类 
型 ， 因 为 它们 最 接近 于 标准 的 SQL 类 型 。 其 他 类 型 是 非 标 准 的 ， 如 果 你 
将 来 需要 移动 数据 ， 其 他 数据 库 系 统 中 可 能 不 支持 这 些 类 型 。 

4. 时 间 类 型 

有 5 种 时 间 数 据 类 型 可 供 使 用 ， 如 表 8-9 所 示 。 


K 8-9 


DECIMAL(P,S 浮 点 刑 


er SR 说 M 
DATE 存 结 从 1000 年 1 月 1 日 -9999 年 12 月 31 日 之 向 的 日 期 
TIME 4248 M-838:59:59-838:59:59. A Ayit fi] 
TIMESTAMP 424% M197098 1 HL -20374F 2 EN RR 
DATETIME 存储 从 1000 年 1 月 1 日 ~-9999 年 12 月 31 日 最 局 一 秒 之 和 间 的 日 期 


IE PERRIN EN, ER, He TANNIN 

请 注意 ， 当 比较 DATE 和 DATETIME 值 以 了 解 时 间 部 分 是 如 何 处 理 
的 时 候 ， 你 需要 格外 小 心 ， 你 可 能 会 看 到 非 期 望 的 结果 。 详 细 信 息 请 得 
向 MySQL 的 手册 ， 因 为 不 同 版 本 的 MySQL 其 行为 稍 有 不 同 。 


8.2.6 创建 表 


至 此 ， 你 已 运行 了 数据 库 服 务 器 ， 了 解 了 如 何 分 配 用 户 权 限 以 及 如 
何 创建 数据 库 和 一 些 基 本 的 数据 库 类 型 ， 现 在 你 可 以 开始 创建 表 了 。 

一 个 数据 库 表 只 不 过 是 一 系列 的 行 ， 而 每 行 又 由 固定 数目 的 列 组 
成 。 它 非常 像 电子 表 格 ， 除 了 每 行 都 必须 包含 相同 数目 和 类 型 的 列 ， 而 
日 每 行 必须 以 某 种 方式 不 同 于 表 中 的 其 他 行 。 

只 要 合乎 情理 ， 一 个 数据 库 可 以 包含 的 表格 数 是 不 受 限制 的 。 但 
是 ， 很 少 有 数据 库 需 要 100 个 以 上 的 表 ， 对 于 大 多 数 小 系统 来 说 ，25 个 
左右 的 表 通 常 就 足够 了 。 

创建 数据 库 对 象 的 完整 SQL 语法 被 称 为 DDL (data definition 
language， 数 据 定义 语言 ) 。 它 相当 复杂 ， 要 想 在 一 章 的 内 容 中 全 面 介 
关于 它 的 详细 内 容 可 以 在 MySQL 网 站 的 文档 区 

到 。 

创建 表 的 基本 语法 是 : 

CREATE TABLE <table name> ( 

column type [NULL | NOT NULL] [AUTO_INCREMENT] 
[PRIMARY KEY] 

[, ...] 

[, PRIMARY KEY (colum [, ... ])] 


) 

你 可 以 用 DROP TABLE 话 法 来 删除 表 ， 这 非常 简单 : 

DROP TABLE <table_name> 

就 目前 而 言 ， 你 仪 需要 了 解 少 数 几 个 关键 字 就 可 以 完成 表 的 快速 创 
建 了 ， 这 几 个 关键 字 如 表 8-10 所 示 。 


表 8-10 


关键 字 说 中 ee 
7TO_INCREMENT 这 一 特殊 的 关键 字 告诉 MySQL， 无 论 何 对 ， 当 你 在 该 烈 中 写 入 NULL 什 时， 它 帮会 自 
动 把 一 个 自动 分 配 的 递增 数字 填 入 列 数 据 中 。 这 是 一 个 非常 有 用 的 特征 ， 它 可 以 通过 
MySQL 素 自动 为 表 中 的 行 分 配 一 个 唯一 的 数字 , 尽管 它 只 能 用 于 属于 主键 的 列 。 在 其 他 
数 轿 自 中 ， 这 一 功能 通常 由 一 个 serial 类 型 提供 ， 或 由 一 个 序列 值 米 明确 管理 
个 特 狐 的 数据 库 值 ， 它 条 常 用 来 表示 “来 知 的 ”， 但 电能 用 素 表 示 “ 无 美的 ”。 例 
如 ， 如 果 你 正在 将 雇员 详细 偿 息 填 入 表 中 ， 可 能 有 一 列 代表 个 人 电子 部 件 地 址 ， 但 是 可 
能 一 些 雇员 没有 个 人 电子 甬 件 地 址 ,在 这 种 情况 下 ,你 应 该 将 典 员 的 电子 邮件 地 址 保存 
为 NULL 以 表示 此 信息 跟 特 定 的 人 无关 。 语 法 NOT LERMA EEF KLL 
对 限 止 某 此 列 持 有 NULL 作 是 很 有 用 和 的， 例如， 有 些 值 如 雇 负 的 姓氏 必须 要 知道 
指出 此 玖 的 数据 必须 是 只 一 的 ， 该 表 每 行 中 对 应 该 列 的 值 都 应 不 同 。 每 个 表 只 能 有 
个 主键 


实 验 创建 表 并 添加 数据 


观看 实践 中 表 的 创建 要 比 学 习 基 本 语法 简单 得 多 ， 所 以 现在 让 我 们 
来 创建 一 个 名 为 children 的 表 。 它 将 为 每 个 孩子 存储 一 个 唯一 的 数字 、 
名 和 年 龄 o BANE Ta ST AE BE 

(1) 你 需要 的 SQL 命 信 令 是 : 


CREATE TABLE chi 
oa ae a AUTO_INCREMENT NOT NULL PRIMARY KEY, 
ame VAC Seek (30) 


注意 ， 与 大 多 数 程 序 设计 语言 不 同 ， 列 名 Cchildno) 出 现在 列 
数据 类 型 (INTEGER) 之 前 。 


(2) 你 还 可 以 使 用 另外 一 种 语法 将 列 定义 和 主键 定义 分 开 ， 下 面 
Oooo 话 显示 了 这 一 语法 : 


» PRIMARY KEY(childno) 
-> 03 


请 注意 我 们 是 如 何 跨越 多 行 输入 SQL 语句 的 ，MySQL 用 -> 提示 符 来 
表示 我 们 位 于 延续 的 行 上 。 同 样 请 注意 ， 正 如 我 们 之 前 提 到 的 那样 ， 我 
人 ee 直 束 SQL 命令 ， 表 示 我 们 已 经 完成 输入 并 准备 好 让 数据 库 处 
理 请 5 

如 果 出 现 了 错误 ，MySQL 人 允许 回 退 到 之 前 的 命令 ， 编 辑 它 并 通过 
按 下 回 车 键 重新 输入 它 。 

(3) 现在 可 以 向 表 中 添加 数据 了 。 我 们 使 用 SQL 命 INSERTS 
加 数据 。 因 为 我 们 定义 childno 列 为 AUTO_INCREMENT 列 ， 所 以 不 需要 
为 此 列 提供 数据 ， 我 们 只 需 让 MySQL 分 配 一 个 唯一 的 数字 。 


mysql> INSERT INTO children(fname, age) VALUES("Jenny", 21); 
K, 1 row affected (0.00 sec 


ysql INGERT INTO chi lár ren(fname, age) VALUES("Andrew", 17); 


我 们 5 ] 可 [以 使 用 SELECT 从 表 中 提取 数据 来 检查 数据 是 否 被 正确 添加 


mysql> SELECT childno, fname, age FROM children; 


与 明确 的 列 出 我 们 想 选 择 的 列 相 比 ， 你 也 可 以 使 用 星 号 〈*) 代表 
列 ， 这 将 列 出 表 中 的 所 有 列 。 这 对 交互 式 的 使 用 会 很 方便 ， 但 在 产品 代 
码 中 ， 你 应 该 始终 明确 地 指定 你 想 要 选择 的 列 。 

实验 解析 

你 启动 了 一 个 对 数据 库 服 务 器 的 交互 式 会 话 ， 并 切换 到 rick 数 据 
库 。 然 后 ， 你 输入 SQL 命令 创建 表 ， 使 用 满足 需要 的 行 来 创建 列 。 一 旦 
使 用 分 号 结束 了 SQL 命令 ，MySQL 了 就 将 创建 表 。 使 用 INSERT 语 句 添 加 
数据 到 新 表 中 ， 人 允许 childno 列 被 自动 分 配 数 字 。 最 后 ， 使 用 SELECT 来 
显示 表 中 的 数据 。 

我 们 在 本 章 中 没有 足够 的 篇 幅 来 介绍 SQL 的 所 有 细节 ， 更 不 用 说 讨 
论 数据 库 设 计 了 。 关 于 SQL 的 更 多 信息 请 访问 www.mysql.com。 


8.2.7 2 化 工具 


人 但 是 如 今 很 多 人 更 喜欢 使 用 图 形 
本 上。 

MySQL 有 两 个 主要 的 图 形 化 工具 : MySQL Has (MySQL 
Administrator) 和 MYySQL 碍 询 浏 览 堪 (MySQL Query Browser) 。 这 些 
工具 的 具体 软件 包 名 称 取决 于 你 所 使 用 的 Linux 发 行 版 。 例 如 ，RedHat 
发 行 版 中 对 应 的 软件 包 名 称 是 mysql-gui-tools 和 mysql-administrator。 对 
Ubuntu 来 次， 你 可 能 需要 首先 司 用 Universe 库 ， 然 后 再 查找 mysdl- 


admin 。 


1. MySQL 查询 浏览 器 


查询 浏览 器 是 一 个 相当 简单、 但 又 很 有 效 的 工具 。 安 装 它 之 后 ， 你 
可 以 通过 GUI 荣 单调 用 它 。 执 行 它 之 后 ， 你 会 看 到 一 个 登录 窗口 要 求 你 
提供 连接 的 详细 信息 ， 如 图 8-4 所 示 。 

如 果 你 是 在 和 服务 器 同一 台 的 机 器 上 运行 它 ， 你 只 需 在 Server 
Hostname 处 输入 localhost 即 可 。 


MySQL Query Browser 


Mys 
Query Browser 


Connect to MySQL Server Instance 
| Stored Connection: | (last connection) 


| Server Hostname: [localhost | Port: (3306 了 


Default Schema: irick | 


| Details >> | | Xx Cancel | Clear |i Connect | 


HERRERIA UCR ES il GULF EL, a A8-5 ATA. 
它 允 许 你 在 一 个 GUI shell 中 执行 查询 命令 、 提 供 图 形 化 编辑 的 所 有 优越 
性 、 一 个 图 形 化 的 编辑 表格 中 数据 的 方式 和 一 些 针 对 SQL 语法 的 帮助 屏 
AF o 


: MySQL Query Browser - rick Glocathost via socket 
fle Edt View Query Script Wols MySQL Enterprise Help 


select * from children| 
teose 
schemata Bookmarks History. 
tad 
informarion_schema 
mysg 


> chidren 
test 


“Syntax | Functions | params ™ 
a 一 一 
v i Data Definition Statements == 
2. ALTER DATABASE Syntax 
Se ALTER TABLE Syntax 


7 rows fetched in 0:00.0620 A Start Editing H First mt Lact J 4 CREATE DATABASE Syntax iS] 
re - 7 43 | ] D 


2. MySQL 管理 器 


我 们 强烈 建议 你 尝试 一 下 MySQL 管 理 器 。 它 是 一 个 针对 MySQL 的 
功能 强大 、 稳 定 和 易于 使 用 的 图 形 化 接口 。 它 针对 Linux 和 Windows 都 
提供 了 预 编 译 的 版 本 (如 果 你 需要 的 话 ， 它 甚至 还 提供 了 源 代码 ) 。 它 
人 
工作 。 

执行 MySQL 管 理 堪 时 ， 你 将 看 到 一 个 与 MySQL 碍 询 浏览 右 的 连接 
窗口 非常 相似 的 窗口 。 在 输入 详细 信息 之 后 ， 你 将 看 到 一 个 主 控 页 面 ， 
如 图 8-6 所 示 。 


MySOL Administrator root Slocaihost via socket 


rr 


7 Server Status: 
E Service Control C Server is running 
国 startup Parameters 


aa User Ad tration Connected to MySQL Server instance 


User: root 


W Server Connections Host: locaihost 

E Heath Socket: 

5r Server Logs Server information 

Gh Backup MySQL Version: MySQL 5.0.37 
Network Name: fc7bip4e 


G Restore Backup IP: 177003 


8 Replication Status Cleat inf 
ea Catalogs Version: MySQL Chent Version 5.0.37 
Network Name: fc 
IP: 127.001 
Operating System: Linux 2.6.21-1.3228.[c7 
Hardware: Intel(R) Pentium(R) 4 CPU 2. 50GHz 2491.383 MHz, 0.7 GB RAM 


图 8-6 


如 果 想 要 通过 Windows 客 户 端 来 管理 MySQL 服 务 器 ， 你 可 以 从 
MySQL 网 站 上 的 GUI 工 具 部 分 下 载 Windows 版 本 的 MySQL 管 理 器 。 在 撰 
写本 书 的 时 候 ， 该 网 站 的 下 载 页 面包 含 管理 器 、 查 询 浏览 器 和 一 个 数据 
库 迁 移 工 具 。Windows 版 本 的 状态 窗口 见 图 8-7， 你 可 以 看 到 ， 它 几乎 和 
Linux 版 本 完全 一 样 。 
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请 记 住 ， 如 果 你 一 直 按 照 本 章 中 的 要 求 在 做 ， 那 么 你 已 对 
MySQL 服 务 器 的 安全 进行 了 加 固 ，root 用 户 只 能 从 localhost 进 行 连 
接 ， 而 不 能 从 网 络 中 的 任何 其 他 机 器 进行 连接 。 


一 旦 MYSQL 管理 器 已 运行 了 ， 你 就 可 以 浏览 一 下 它 的 不 同 配置 和 
监控 选项 。 它 是 一 个 非常 易于 使 用 的 工具 ， 但 我 们 在 本 章 中 没有 足够 的 
篇 幅 来 详细 介绍 它 了 。 


8.3 C 话 言 访问 MySQL 关 


至 此 我 们 已 掌握 了 MySQL 的 入 门 知识 ， 下 面 让 我 们 探究 一 下 如 何 
通过 应 用 程序 来 访问 MySQL， 而 不 是 使 用 GUI 工具 或 基本 的 mysql 客 户 


端 。 
我 们 可 以 通过 许多 不 同 的 编程 语言 来 访问 MySQL， 包 括 : 
C 
C++ 


口 口 口 口 口 口 口 口 口 


Windows Hh#EF (如 Access) 也 可 以 通过 ODBC 了 驱动 程序 来 访问 
MySQL， 甚 至 还 有 针对 Linux 的 ODBC 了 驱动 程序 ， 尺 管 我 们 没有 什么 理 
由 来 使 用 它 。 

在 本 章 中 ， 我 们 将 主要 讨论 C 语 言 接口 ， 因 为 这 是 本 书 的 重点 ， 而 
且 许 多 其 他 语言 也 使 用 相同 的 库 来 建立 连接 。 


8.3.1 连接 例 程 


用 C 语 言 连接 MySQL 数 据 库 包含 两 个 步 又 
O “初始 化 一 个 连接 句柄 结构 ; 

O “实际 进行 连接 。 

首先 ， 使 用 mysqlL_init 来 初始 化 连接 句柄 ; 


#include <mysql.h> 


MYSQL *mysql_init (MYSQL *); 


通常 你 传递 NULL 给 这 个 例 程 ， 它 会 返回 一 个 指 同 新 分 配 的 连接 句 
柄 结构 的 指针 。 如 果 你 传递 一 个 已 有 的 结构 ， 它 将 被 重新 初始 化 。 这 个 
例 程 在 出 错时 返回 NULL。 

目前 为 止 ， 你 只 是 分 配 和 初始 化 了 一 个 结构 。 你 仍然 需要 使 用 
mysql_real_connect 来 向 一 个 连接 提供 参数 : 


MYSQL *mysql_real_connect (MYSQL *connection, 
const char *server_host, 
const char *sql user name, 
const char *sql password, 
const char ‘*db_name, 
unsigned int port_number, 


指针 connection 必 须 指 疝 已 经 被 mysql]_init 初 始 化 过 的 结构 。 其 他 参 
数 的 合 义 都 相当 明了 ， 但 是 ， 请 注意 server_host 既 可 以 是 主机 名 ， 也 可 
以 是 IP 地 址 。 如 果 只 是 连接 到 本 地 机 器 ， 你 可 以 通过 指定 localhost 来 优 
化 连接 类 型 。 

sql_user_name 和 sql_password 的 含义 和 它们 的 字面 含义 一 样 。 如 果 
登录 名 为 NULL， 则 假设 登录 名 为 当前 Linux 用 户 的 登录 ID。 如 果 密 码 为 
NULL， 你 将 只 能 访问 服务 器 上 无 需 密码 就 可 访问 的 数据 。 密 码 会 在 通 
过 网 络 传输 前 进行 加 密 。 

port_number 和 unix_socket_name 应 该 分 别 为 0O 和 NULL， 除 非 你 改变 
了 MySQL 安 装 的 默认 设置 。 它 们 将 默认 使 用 合适 的 值 。 

最 后 ，flags 参 数 用 来 对 一 些 定义 的 位 模式 进行 OR 操作 ， 使 得 改变 
使 用 协议 的 某 些 特性 。 对 于 像 本 章 这 样 的 介绍 性 章节 来 说 ， 这 些 标志 都 
没什么 用 处 ， 详 细 的 资料 请 参考 使 用 手册 。 
它 将 返回 NULL 。mysqlL_error 函 数 可 以 提供 有 帮助 

使 用 完 连 接 之 后 ， 通 常 在 程序 退出 时 ， 你 要 像 下 面 这 样 调用 函数 


mysql_close: 


const char *unix_socket_name, 
unsigned int flags); 


这 将 关闭 连接 。 如 果 连 接 是 由 mysql_init 建 立 的 ，MySQL 结 构 会 被 
释放 。 指 针 将 会 失效 并 无 法 再 次 使 用 。 保 留 一 个 不 需要 的 连接 是 对 资源 
的 浪费 ， 但 是 重新 打开 连接 也 会 带 来 额外 的 开销 ， 所 以 你 必须 自己 权衡 
何 时 使 用 这 些 选 项 。 

mysqlL_options 例 程 〈 仅 能 在 mysql_init 和 mysql_real_connect 之 间 调 
用 ) 可 以 设置 一 些 选 项 : 


int mysql options (MYSQL *connection, enum option_to_set, 
const char *argument); 


因为 mysql_options 一 次 只 能 设置 一 个 选项 ， 所 以 每 设置 一 个 选项 就 
得 调用 它 一 次 。 你 可 以 根据 需要 多 次 使 用 它 ， 只 要 它 出 现在 mysql_init 
和 mysql_real_connect 之 间 即 可 。 并 不 是 所 有 的 选项 都 是 char 类 型 ， 因 此 
它们 必须 被 转换 为 const char *。 表 8-11 中 列 出 了 3 个 最 常用 的 选项 。 与 往 
第 一 样 ， 完 整 的 选项 请 参见 在 线 手 册 。 


表 8-11 


enumit i“ 实际 参数 类 型 说 明 


一 次 成 功 的 调用 将 返回 0。 因 为 它 仅 仅 是 用 来 设置 标志 ， 所 以 失败 
总 是 意味 痢 使 用 了 一 个 无 效 的 选项 。 
如 果 要 设置 连接 超时 时 间 为 7 秒 ， 我 们 使 用 的 代码 片断 如 下 所 示 : 


M) L_OPT_CONNECT_TIMEOUT 


至 此 你 已 学 会 了 如 何 建立 和 关闭 连接 ， 下 面 我 们 使 用 一 个 简短 的 程 
序 来 测试 一 下 。 

首先 为 用 户 设 置 一 个 新 的 密码 (在 下 面 的 代码 中 ， 是 本 机 上 的 rick 
用 户 ) ， 然 后 创建 要 连接 的 数据 库 foo。 上 述 工 作对 你 来 说 都 应 该 很 熟 
悉 ， 所 以 我 们 将 只 显示 它们 执行 的 顺序 : 


5 mysql -u root -p 
mysg GRANT ALL ON *.* TO rick@localhost IDENTIFIED BY 'secret'; 


mysql> \q 


5 mysql -u rick -p 
Enter password: 
mysql> CREATE DATABASE foo; 


现在 你 已 创建 了 新 数据 库 。 如 果 直 接 在 mysql 命 令 行 中 输入 许多 创 
建 表 和 诬 加 数据 的 命令 ， 这 比较 容易 出 错 ， 而 且 如 采 需 要 再 次 输入 这 些 
命令 的 话 ， 这 种 方法 也 显得 不 够 高 效 。 为 此 ， 你 应 该 创建 一 个 包含 你 所 
需要 命令 的 文件 。 

这 个 文件 为 create children.sql: 


ALUE ‘Jenny 1 
ALUE: ‘Andrew’, 1 
VALUE , ‘Gavi 
VALUE ‘Dun 
I T INT hildy VALUES (5, 'Emma', 
INSERT INTO chil since >, fname, age) VALUES Speer 
£ age VALUES (7, ‘Adrian 


INSERT INTO ct? fname, ag 


现在 ， 你 可 以 重新 登录 MySQL， 选 择 数据 库 foo, 并 执行 这 个 文件 。 
ee ee rio anger 我 们 将 密码 放 在 了 命令 行 


$ ee -u FE - SERTE secret foo 
elcome to the MySOQ i ommands end with 


mysql> \. create_children.sql 
rows affected (0.01 sec 


我 们 已 删除 了 输出 中 的 许多 重复 行 ， 它 们 都 是 在 数据 库 中 创建 行 时 
生成 的 。 现 在 你 有 一 个 用 户 、 一 个 数据 库 和 一 个 保存 了 一 些 数据 的 表 ， 
是 时 候 看 一 下 如 何 通 过 代码 来 访问 这 些 数据 了 。 

下 面 是 源 文 件 connect1l.c， 它 以 用 户 名 rick 和 密码 secret 来 连接 本 机 服 
务 器 上 名 为 foo 的 数据 库 : 


de “mys 
roan argc, cha argv{] 
nptr = mysql_i (NULL 
if (!conn_ptr) { 
fprintf(stderr, “mysql led 
return EXIT_FAILURE; 
} 
pt mysqi Sean pee ee: SO eee AS nee 
f (conn_pt { 
eee (*Conne ess\ 
ee ntft(* nn ion failed\n 
mysql_clos nn ptr 
; return EXIT_SUCCESS; 
SUE FT UR a PEK SREP VR EY BE m Ze [el NY Ys Dl includeré 47 eMC FF 
路 径 ， 以 及 指定 链接 的 库 模 块 mysqlcliento 在 某 些 系统 上 ， 你 可 能 还 需要 
使 用 -1z 选 项 来 链接 压缩 库 。 在 我 的 系统 上 ， 和 需要 的 编译 指令 为 : 


你 可 能 需要 检查 是 否 安装 了 客户 端 软件 包 ， 它 们 的 安 厂 位 置 取决 于 
你 所 使 用 的 Linux 发 行 版 ， 你 需要 根据 它们 的 位 置 对 上 面 的 编译 行 做 出 
会 看 到 一 条 连接 成 功 的 信息 : 


相应 的 调整 。 
运行 它 时 ， 你 只 
> «/connectl 


在 第 9 章 中 ， 我 们 将 演示 如 何 通过 创建 一 个 makefile 文 件 来 将 连接 程 


序 的 构建 自动 化 。 
可 以 看 出 ， 与 MySQL 数 据 库 建 立 连 接 是 很 简单 的 。 


8.3.2 ”错误 处 理 
在 我 们 介绍 更 复杂 的 程序 之 前 ， 了 解 一 人 MySQL 如何 进行 错误 处 
理 是 很 有 用 的 。MySQL 使 用 一 系列 由 连接 句柄 结构 报告 的 返回 码 。 两 


个 必 备 的 例 程 是 : 


unsigned int mysql_errno(MYSQL *connection) ; 
和 

char *mysql_error(MYSQL *connection) ; 

你 可 以 通过 调用 mysql_errno 并 传递 连接 结构 来 获得 错误 码 ， 它 通常 
都 是 非 0 值 。 如 果 未 设 定 错误 码 ， 它 将 返回 0。 因 为 每 次 调用 库 都 会 更 新 
错误 码 ， 所 以 你 只 能 得 到 最 后 一 个 执行 命令 的 错误 码 。 但 是 上 面 列 出 的 
两 个 错误 检查 例 程 是 例外 ， 它 们 不 会 导致 错误 码 的 更 新 。 

mysqlL_errno 的 返回 值 实际 上 束 是 错误 码 ， 它 们 在 头 文件 errmsg.h 或 
mysqld_error.h 中 定义 。 这 两 个 文件 都 可 以 在 MySQL 的 include 目 录 中 找 
到 。 前 者 报告 客户 端 错 误 ， 后 者 关注 服务 端 错误 。 

如 果 你 更 喜欢 文本 错误 信息 ， 也 可 以 调用 mysql_error， 它 提供 了 有 
意义 的 文本 信息 而 不 是 单调 的 错误 码 。 这 些 信 息 被 写 入 一 些 内 部 静态 内 
存 空 间 中 ， 所 以 如 果 想 保存 错误 文本 ， 你 需要 把 它 复 制 到 别 的 地 方 。 

你 可 以 在 代码 中 添加 一 些 基 本 的 错误 处 理 来 观察 它们 的 行为 。 你 可 
能 已 经 注意 到 ， 当 调用 mysql_real_connect 时 会 遇 到 一 个 问题 ， 因 为 它 在 
失败 时 返回 NULL 指 针 ， 并 没有 提供 一 个 错误 码 。 但 如 果 你 将 连接 句柄 
作为 一 个 变量 ， 那 么 即使 mysqlL_real_connect 失 败 ， 你 仍然 能 够 处 理 它 。 

下 面 是 源 文件 connect2.c， 它 示例 了 如 何 使 用 非 动态 分 配 的 连接 结 
构 ， 以 及 如 何 编写 一 些 基本 的 错误 处 理 代 码 。 源 文件 中 修改 的 部 分 以 阴 


BY A 
WEZ: 


HEEL OEE eE HR PHEA ETTA, PRY MRE Sy HR 
mysql_real_connect 失 败 所 带 来 的 问题 。 不 仅 如 此 ， 这 也 是 另 一 种 使 用 连 
接 结构 的 好 例子 。 你 可 以 使 用 一 个 错误 的 用 户 或 密码 来 强制 生成 错误 ， 
从 而 得 到 类 似 于 mysql 工 具 提 供 的 错误 码 。 


> ./connect2 
nnection fail 


8.3.3 行 SQL 语 所 


你 已 能 够 连接 数据 库 并 正确 处 理 错 误 了 ， 现 在 是 时 候 让 程序 做 一 些 
实际 的 工作 了 。 执 行 SQL 语句 的 主要 API 函 数 被 恰当 的 命名 为 : 


int mysql_query(MYSQL *connection, const char *query) 


不 是 太 难 吧 ? 这 个 例 程 接 受 连接 结构 指针 和 文本 字符 串 形式 的 有 效 
SQL 语 句 〈 没 有 结束 的 分 号 ， 这 与 mysql 工 具 不 同 ) 。 如 果 成 功 ， 它 返 
回 0。 对 于 包含 二 进 制 数据 的 查询 ， 你 可 以 使 用 第 二 个 例 程 
mysql_real_query， 但 是 在 本 章 中 ， 我 们 将 只 使 用 mysql_query。 

1. 不 返回 数据 的 SQL 语句 

为 简单 起 见 ， 我 们 首先 来 看 一 些 不 返回 任何 数据 的 SQL 语句 : 
UPDATE、DELETE 和 INSERT。 

我 们 将 在 这 里 介绍 男 一 个 重要 函数 ， 它 用 于 检查 受 查 询 影 响 的 行 
my_ulonglong mysql_affected_rows(MYSQL *connection); 


你 很 可 能 首先 注意 到 的 是 这 个 函数 的 返回 值 类 型 很 不 常见 。 它 使 用 
无 符号 类 型 是 出 于 移植 性 的 考虑 。 当 你 使 用 printf 时 ， 我 们 推荐 使 用 %lu 
格式 将 其 转换 为 无 符号 长 整 型 。 这 个 函数 返回 受 之 前 执行 的 UPDATE、 
INSERT 或 DELETE 碍 询 影响 的 行 数 。 如 果 你 使 用 过 其 他 SQL 数据 库 ， 
MySQL 的 返回 值 可 能 会 让 你 感到 意外 。MySQL 返 回 的 是 被 一 个 更 新 操 
作 修改 的 行 数 ， 但 许多 其 他 数据 库 将 仅仅 因为 记录 匹配 WHERE 子 句 就 
把 它 视 为 已 经 更 新 过 。 

通常 对 于 mysql_ 系列 函数 ， 返 回 值 0 表示 没有 行 受 到 影响 ， 正 数 则 
是 实际 的 结果 ， 一 般 表 示 受 语句 影响 的 行 数 。 

首先 ， 你 需要 在 数据 库 foo 中 创建 children 表 〈 如 果 你 之 前 没有 这 人 么 
做 的 话 ) 。 删 除 〈 使 用 drop 命 令 ) 任何 已 有 的 表 以 确保 你 有 一 个 整洁 的 
表 定 义 ， 并 重新 发 送 在 AUTO_INCREMENT 列 中 使 用 的 任何 ID: 


í ee A ee near aie OT TE EPE FI A aws ie a ee Ges ee "EIT 
$ mysql -u rick -p foo 

m Commands end with ; or \g 

ysql> DROP TABLE children; 


+} sec 


mysql> CREATE TABLE children ( 
childno int(11) AUTO_INCREMENT NOT NULL PRIMARY KEY, 
fname varchar (30), 
age int 
> Dp 
Query OK, 0 rows affected .09 sec 


现在 ， 在 connect2.c 源 文件 中 添加 一 些 代码 以 在 表 中 插入 一 个 新 
行 ， 这 个 新 程序 被 命名 为 insert1.c。 需 要 注意 的 是 ， 下 面 代 码 中 显示 的 
折 行 是 由 于 物理 页 面 的 限制 ， 你 通常 不 会 在 实际 的 SQL 语句 中 使 用 换行 
符 ， 除 非 它 是 一 个 非常 长 的 语句 。 如 果 是 这 种 情况 ， 你 可 以 在 行 尾 使 用 
\ 字 符 以 允许 SQL 语句 继续 到 下 一 行 。 


@include <stdlib.h> 
人 include <stdio.h> 


mysqi_in m nnectio 
f imysql_real_connect a 
i NUL 
prin n n 


res = mysql_query (&my connection, ‘INSERT INTO children(fname, age) 
VALUES ('Ann’, 3)"); 
if (tres) { 
printf (*Inserted lu rows\n", 
(unsigned long) mysql_affected_rows(&my_connection) ); 
) else { 
fprintf(stderr, “Insert error td: %s\n*, mysql_errno(émy_connection), 
mysql_error(a&my_connection) ); 


) 
my l 
£ ir rr nnection 
f im rr my_connecti 
n rr onnection e n 
errno [&m y jie 
return EXIT SUCCESS; 


训 不 奇怪 ， 我 们 插入 了 一 行 数据 。 
现在 ， 让 我 们 改变 代码 来 包含 UPDATE 而 不 是 INSERT， 并 且 观 察 
受 影响 的 行 是 如 何 被 报告 的 。 


mysql errno lény connection), mysql_error(&my_connection) 


res = mysql_query (åmy_ connection, "UPDATE children SET 
W 


Ẹ tf ("Updated tlu rows\n*, 
unsigned long) mysql_affected_rows (tmy connection 


Passe i 
fprintf(stderr, “Update error td: ts\n", mysql_errno(ámy_ connection 
mysql error (&my_connection]) }; 


我 们 将 此 程序 叫做 updatel.c。 它 试图 将 所 有 叫做 Ann 的 孩子 的 年 龄 
设 为 4。 现 在 ， 假 设 children 表 中 有 如 下 数据 ; 
mysql> SELECT * from CHILDREN; 
erga regen ey eye ge 


| childno 


+ 
| 
| 
| 
| 
| 
| 
| 
| 
| 


Alex 


Fowo way nw & WN FP 


e e 


a 
| 
| 
I 
| 
l 
| 
| 
| 
| 
十 
| 
| 
| 
| 
| 
| 
| 
| 
让 
| 
| 
| 
| 
| 
| 
Ti 


11 rows in set (0.00 sec) 

请 注意 有 4 个 孩子 的 名 字 匹 配 Ann。 如 果 执 行 updatel， 你 可 能 会 认 
为 受 影 响 的 行 数 为 4， 这 是 由 WHERE 子 句 匹配 的 行 数 。 但 是 ， 你 会 看 到 
程序 报告 仅 有 2 行 受 影响 ， 这 是 因为 实际 需要 对 数据 进行 修改 的 行 数 只 


有 2 行 。 你 可 以 使 用 mysql_real_connect 的 CLIENT_FOUND_ROWS 标 志 
来 获得 更 传统 的 报告 。 


t(&my_connection, “localhost”, 
foo*, 0, NULL, CLIENT_FOUND_ROw: 


a E 3 E 
行 数 为 4。 

函数 mysql_affected_rows 还 有 最 后 一 个 古怪 之 处 ， 它 出 现在 从 数据 
库 中 删除 数据 的 时 候 。 如 果 你 使 用 WHERE 子 句 删除 数据 ， 那 么 
mysql_affected_rows 将 返回 你 期 望 的 删除 的 行 数 。 但 如 果 在 DELETE 语 
句 中 没有 WHERE 子 句 ， 那 么 表 中 的 所 有 行 都 会 被 删除 ， 但 是 由 程序 返 
回 的 受 影 响 行 数 却 为 0。 这 是 因为 MySQL 优 化 了 删除 所 有 行 的 操作 ， 它 
并 不 是 执行 许多 个 单行 删除 操作 。 这 一 行为 不 会 受 
CLIENT_FOUND_ROWS 选 项 标志 的 影响 。 


2. 发 现 插 入 的 内 容 


插入 数据 有 一 个 微小 但 至 关 重 要 的 方面 。 还 记得 我 们 提 过 
AUTO_INCREMENT 类 型 的 列 吗 ? 它 由 MySQL 自动 分 配 ID。 这 一 特性 
非常 有 用 ， 特 别 是 当 你 有 许多 用 户 的 时 候 。 

让 我 们 再 次 查看 表 的 定义 : 


正如 你 看 到 的 那样 ，childno 列 被 设 为 AUTO_INCREMENT 类 型 。 这 
样 当然 很 好 ， 但 是 一 旦 你 插入 一 行 ， 你 如 何 知 道 刚 插 入 的 孩子 被 分 配 了 
什么 数字 呢 ? 

你 可 以 执行 一 条 SELECT 语 句 来 搜索 孩子 的 名 字 ， 但 这 样 效率 会 很 
低 ， 并 且 如 果 有 两 个 相同 名 字 的 孩子 ， 这 将 不 能 保证 唯一 性 。 或 者 ， 如 
果 同 时 有 多 个 用 户 快 速 地 插入 数据 ， 那 么 可 能 在 更 新 操作 和 SELECT 语 
句 之 间 会 有 其 他 行 被 插入 。 因 为 发 现 一 个 AUTO_INCREMENT 列 的 值 是 
大 家 都 面临 的 一 个 共同 问题 ， 所 以 MySQL 以 函数 LAST_INSERT_ID0O 的 
形式 提供 了 一 个 专门 的 解决 方案 。 

无 论 何 时 MySQL 向 AUTO_INCREMENT 列 中 插入 数据 ，MySQL 都 
会 基于 每 个 用 户 对 最 后 分 配 的 值 进行 跟踪 。 用 户 程序 可 以 通过 SELECT 
T a G a 

JAE. l Fl o 


实 验 提取 由 AUTO_INCREMENI 生 成 的 ID 
A 以 通过 插入 数据 到 表 中 并 执行 LAST_INSERT _IDO 函 数 来 查看 


sql SENER _ gs age) VALUES('Tom', 13); 
Query OK, e 


ysql> SELECT LAST. INSERT 1 


和 


mysql> INSERT INTO children (fname, aga) VALUES ( 'Harry', 17); 


mysql> SELECT LAST_ INSERT. 1D(); 


实验 解析 

每 次 插入 一 行 ，MySQL 就 分 配 一 个 新 的 id 值 并 且 跟 踪 它 ， 使 得 你 可 
以 用 LAST_INSERT_IDO 来 提取 它 。 

如 果 想 通过 实验 得 看 返回 的 数字 在 本 次 会 话 中 确实 是 唯一 的 ， 那 么 
你 可 以 打开 男 一 个 会 话 并 插入 为 一 行 数据 。 然 后 在 最 初 的 会 话 中 重新 执 
行 SELECT ”LAST_INSERT_IDQO; 语句 。 你 将 看 到 数字 并 没有 发 生 改 
变 ， 这 是 因为 该 语句 返回 的 数字 是 由 当前 会 话 插入 的 最 后 一 个 数字 。 但 
是 ， 如 果 执 行 SELECT *FROM children， 你 将 看 到 其 他 会 话 确实 已 插入 
数据 了 。 


X 验 在 C 程 序 中 使 用 自动 分 配 的 ID 

在 本 例 中 ， 我 们 将 修改 insert1.c 程 序 以 查看 这 些 操作 是 如 何在 C 语 言 
o 代码 中 的 关键 修改 将 以 阴影 显示 。 我 们 把 修改 后 的 程序 命名 
为 insert2.C。 


j amy 1 10 
ey 3 stick”, I 
prin cti à ) 
m _qu yu connection, “INSERT INTO children (fname, age 
fALUES Te 
f ("int t rows) igned 
weg. affected. ws (ir unec 
p st r ert è ta : by e FT CO 
mysqi_er am onne 
res = mysql_query(&my_commection, “SELECT LAST_INSERT_ID()*); 
if (res) { 
printf (*SELECT error: ts\n", mysql_error(&my_connection)); 
) else { 
res_ptr = mysql_use_result (4my_connection); 
if (res_ptr) { 
while (({sqlrow = mysgi_fetch_row(res_ptr))) ( 
printf(*We inserted childno s\n", sqlrow(0]); 
mysql_free_ result (res_ptr); 
} 
yagis emy 
r f de *Connect failedin*); 
m rrr ény „conne m | 
x de Connection err 二 n* 
mysql_errn m nect mysql.e am ec 


Hg O A 
下 面 是 这 个 程序 的 输出 : 
$ gee -I/usr/include/mysql insert2.c -L/usr/lib/mysql -lmysqlclient -o insert2 
$ ./insert2 
Connection success 


rows 


We inserted childno 6 
$ ./insert2 
Connection success 
Inserted 1 rows 


实验 解析 

在 插入 一 行 之 后 ， 你 用 LAST_INSERT_IDO 函 数 来 获取 分 配 的 ID， 
就 像 常 规 的 SELECT 语句 一 样 。 然 后 使 用 mysql_use_result 0 从 执行 的 
SELECT 语句 中 获取 数据 并 将 它 打印 出 来 ， 我 们 稍 后 将 解释 此 函数 。 不 
要 对 刚才 获取 数值 的 机 制 过 于 担心 ， 我 们 将 在 后 面 几 页 中 介绍 它们 。 


3. 返回 数据 的 语句 


SQL 最 常见 的 用 法 当然 是 提取 数据 而 不 是 插入 或 更 新 数据 。 数 据 是 
使 用 SELECT 语句 提取 的 。 


MySQL 也 支持 使 用 SQL 语句 SHOW、DESCRIBE 和 EXPLAIN 
来 返回 结果 ， 但 我 们 不 会 在 这 里 涉及 它们 。 按 照 惯例 ， 手 册 中 包含 
了 对 这 些 语句 的 解释 。 


在 C 应 用 程序 中 提取 数据 一 般 需 要 下 面 4 个 步骤 : 

O 执行 查询 ; 

口 提取 数据 ; 

o 处 理 数 据 ; 

O 必要 的 清理 工作 。 

就 像 之 前 的 工 NSERT 和 DELETE 语 句 一 样 ， 你 将 使 用 mysql_query 来 
发 送 SQL 语 句 。 然 后 ， 你 使 用 mysql_store_result 或 mysql_use_result 来 提 
取 数 据 ， 有 具体 使 用 哪个 函数 取 雇 于 你 想 如 何 提取 数据 。 接 着 ， 你 将 使 用 
一 系列 mysql_fetch_row 调 用 来 处 理 数据 。 最 后 ， 使 用 mysql_free_result 
释放 查询 占用 的 内 存 资源 。 

mysql_use_result 和 mysq]_store_result 的 区 别 主要 在 于 ， 你 是 想 一 次 
返回 一 行 数据 ， 还 是 一 次 返回 所 有 的 结果 。 当 你 预计 结果 集 比 较 小 时 ， 
后 者 会 更 加 合适 。 

“一 次 提取 所 有 数据 的 函数 

你 可 以 使 用 mysql_store_result 在 一 次 调用 中 从 SELECT 〈 或 其 他 返 
回 数据 的 语句 ) 中 提取 所 有 数据 ; 


MYSQL RES *mysql_store_result (MYSQL *connection) ; 


显然 ， 你 需要 在 成 功 调用 mysqlL_query 之 后 使 用 此 函数 。 这 个 函数 
将 立刻 保存 在 客户 端 中 返回 的 所 有 数据 。 它 返回 一 个 指 同 结果 集结 构 的 
虽 针 ， 如 采 失 败 则 返回 NULL。 

在 mysql_store_result 调 用 成 功 之 后 ， 你 需要 调用 mysql_num_rows 来 
得 到 返回 记录 的 数目 ， 我 们 希望 这 是 个 正 数 ， 但 是 如 果 没 有 返回 行 ， 这 
个 值 将 是 0。 
my ulonglong mysql_num_rows(MYSQL_RES *result); 


这 个 函数 接受 由 mysql_store_result 返 回 的 结果 结构 ， 并 返回 结果 集 
中 的 行 数 。 如 果 mysql_store_result 调 用 成 功 ，mysqlL_num_rows 将 始终 都 
是 成 功 的 。 

通过 对 这 些 函数 的 组 合 使 用 ， 你 获得 了 一 种 提取 你 所 需要 数据 的 简 
单方 法 。 到 了 这 里 ， 所 有 数据 对 于 客户 端 来 说 都 是 本 地 的 ， 你 不 再 需要 


担心 可 能 的 网 络 或 数据 库 错 误 了 。 对 返回 行 数 的 获取 将 有 助 于 你 进行 随 
后 的 编程 。 

如 果 你 人 碰巧 使 用 的 是 一 个 特别 庞大 的 数据 集 ， 那 么 最 好 提取 小 一 
些 、 更 容易 管理 的 信息 块 ， 因 为 这 将 更 快 地 将 控制 权 返 回 给 应 用 程序 ， 
并 且 不 会 占用 大 量 的 网 络 资源 。 我 们 将 在 介绍 mysql_use_result 的 时 候 ， 
详细 探讨 这 一 想法 。 

现在 ， 你 可 以 使 用 mysql_fetch_row 来 处 理 它 ， 也 可 以 使 用 
mysql_data_seek、mysql_row_seek 和 mysql_row_tell 在 数据 集中 来 回 移 
动 。 下 面 让 我 们 来 看 看 这 些 函 数 。 

O mysql_fetch_row: 这 个 函数 从 使 用 mysql_store_result 得 到 的 疆 
条 结构 中 提取 一 行 ， 并 把 它 放 到 一 个 行 结构 中 。 当 数据 用 完 或 发 生 错 误 
时 返回 NULL。 我 们 将 在 下 一 节 中 回 过 来 处 理 行 结构 中 的 数据 。 
MYSQL ROW mysql fetch_row(MYSQL RES *result); 

O mysql _data_seek: 这 个 函数 用 来 在 结果 集中 进行 跳 转 ， 设 置 将 

会 被 下 一 个 mysql_fetch_row 操 作 返 回 的 行 。 参 数 offset 的 值 是 一 个 

行 号 ， 它 必须 在 0 到 结 末 集 总 行 数 减 1 的 范围 内 。 传 递 0 将 会 导致 下 

一 个 mysql_fetch_row 调 用 返回 结果 集中 的 第 一 行 。 
void mysql_data_seek(MYSQL_RES *result, my_ulonglong offset); 

O mysql row_tell: 这 个 函数 返回 一 个 偏 移 值 ， 它 用 来 表示 结果 集 

中 的 当前 位 置 。 它 不 是 行 写 ， 你 不 能 把 它 用 于 mysql_data_seek。 

MYSQL_ ROW OFFSET mysql_row_tell(MYSQL_RES *result); 
O 但 是 ， 你 可 以 这 样 使 用 它 的 返回 值 : 


MYSQL ROW OFFSET mysql_row_seek(MYSQL RES *result, MYSQL ROW OFFSET offset); 


这 将 在 结果 集中 移动 当前 位 置 ， 并 返回 之 前 的 位 置 。 


这 对 函数 对 于 在 结果 集中 的 已 知 点 之 间 的 移动 非常 有 用 。 但 请 
小 心 不 要 混淆 了 由 row_tell 和 row_seek 使 用 的 偏 移 量 和 data_seek 使 用 
的 行 号 。 否 则 ， 结 果 将 变 得 不 可 预知 。 


O 完成 了 对 数据 的 所 有 操作 后 ， 你 必须 明确 地 调用 
mysdql_free_result 来 让 MySQL 库 完成 善后 处 理 。 
void mysql free result (MYSQL_RES *result); 


O 完成 了 对 结果 集 的 操作 后 ， 你 必须 总 是 调用 此 函数 来 让 MySQL 
库 清理 它 分 配 的 对 象 。 


“提取 数据 

现在 可 以 编写 你 的 第 一 个 数据 提取 应 用 程序 了 。 你 想 要 选择 所 有 年 
龄 大 于 5 的 记录 。 因 为 还 不 知道 如 何 处 理 这 些 数据 ， 所 以 你 将 仅仅 提取 
它们 。 提 取 结 果 集 并 过 历 提 取 数 据 的 重要 代码 片断 用 阴影 显示 。 下 面 是 
select1.c 的 源 代码 : 


finclude di 
#i i 
‘ "mys 


nnectio 
MY. res_ptr 
MY‘ qlrow:; 
nt main arg ar *argv[)) { 
nt re 
y mectior 
£ (mysql_real_connect (&my_connection, ‘localhost’, “rick”, 
*secret*, "foo", 0, NULL, 0 
rir nne success\n 
res = mysql_query (&my_ connection, "SELECT childno, fname, 
age FROM children WHERE age > 5°"); 
i re 
printf ELECT error: ts\n*, mysql error (&my_connection) |} ; 


res_ptr = mysql_store_result (&my_connection) ; 
if (res ptr) { 
printf£{*Retrieved tiu rows\n", (unsigned long) mysql_num_rows(res_ptr)); 
while ((sqlrow = mysql_fetch_row(res_ptr))) { 
printf(*Fetched data...\n"); 


f (mysql errno(ámy_ connection) 
fprintf(stderr, "Retrive error: %s\n", mysql_error (kmy_ connection) ); 
m ée es e D 
m m cti 
fprin t Conne failed\n” 
m my t ) { 
r r y error td: ts 
m e am ur m), my _er m i 


一 次 提取 一 行 数 杨 
为 了 逐 行 提取 数据 一 一 如 果 这 是 你 真正 想 要 的 ， 你 将 依靠 


mysql_use_result 而 不 是 mysql_store_result。 


MYSQL RES *mysql_use_result (MYSQL *connection); 


与 mysql_store_result 函 数 一 样 ，mysql_use_result 在 遇 到 错误 时 也 返 


回 NULL。 如 果 成 功 ， 它 返回 指 网 结 采 集 对 象 的 指针 。 但 是 ， 不 同 之 处 
在 于 它 未 将 提取 的 数据 放 到 它 初 始 化 的 结果 集中 。 


为 了 真正 得 到 数据 ， 你 必须 反复 调用 mysql_fetch_row 直 到 提取 
了 所 有 的 数据 。 如 果 没 有 mysql_use_result 中 得 到 所 有 数据 ， 那 么 程 
序 中 后 续 的 提取 数据 操作 可 能 会 返回 遭 到 破坏 的 信息 。 


那么 ， 调 用 mysqlL_use_result 和 调用 mysql_store_result 的 效果 有 何不 
同 呢 ? 前 者 具备 资源 管理 方面 的 实质 性 好 处 ， 但 是 它 不 能 与 
mysql_data_seek、 或 mysql_row_seek 或 mysql_row_tell 一 起 使 用 ， 并 且 由 
T a 有 数据 都 被 提取 后 才能 实际 生效 ，mysql_num_rows 的 使 用 也 受 
到 限制 。 

你 还 增加 了 时 延 ， 因 为 每 个 行 请 求 和 结果 的 返回 都 必须 通过 网 络 。 
oo es 网 络 连接 可 能 在 操作 中 途 失 败 ， 留 给 你 不 完 
整 的 数据 。 

但 是 ， 无 论 怎样 ， 这 些 都 不 会 抹 去 我 们 之 前 提 到 的 它 带 来 的 好 处 : 
Sees 以 及 减少 了 可 能 非常 大 的 数据 集 带 来 的 存储 开 
销 。 


把 select1.c 修 改 为 select2.c， 这 里 将 使 用 mysqlL_use_result 函 数 。 因 为 
很 简单 ， 所 以 我 们 仅仅 以 阴影 方式 显示 修改 的 代码 族 断 : 


$_ptr mysqi_use_result (&my_connection) ; 


注意 观察 ， 在 提取 最 后 一 个 结果 之 前 ， 你 仍然 无 法 得 到 行 数 。 但 
是 ， 通 过 早期 和 经 常 性 的 错误 检查 ， 可 以 使 得 程序 调整 为 使 用 
mysql_use_result 变 得 更 加 容易 。 以 这 种 方式 编写 代码 可 以 减少 许多 程序 
后 期 修改 带 来 的 烦恼 。 

4. 处 理 返回 的 数据 
下 面 可 以 学 习 如 何 处 理 返 回 的 实际 数 
如 同 大 多 数 SQL 数 据 库 一 样 ，MySQL 返 回 两 种 类 型 的 数据 。 
O 从 表 中 提取 的 信息 ， 也 就 是 列 数据 。 


OD “关于 数据 的 数据 ， 即 所 谓 的 元 数据 (metadata) ， 例 如 列 名 和 
类 型 


让 我 们 首先 关注 如 何 将 数据 本 身 转化 为 有 用 的 形式 。 
mysql_field_count 函 数 提 供 了 一 些 关 于 碍 询 结果 的 基本 信息 。 它 接 
受 连 接 对 象 ， 并 返回 结果 集中 的 字段 〈 列 ) 数目 : 


unsigned int mysql field count (MYSQL *connection) ; 


在 更 通用 的 方式 下 ， 你 可 以 用 mysql_field_count 做 其 他 事情 ， 比 如 
判断 为 何 mysql_store_result 的 调用 会 失败 。 例 如 ， 如 果 
mysql_store_result 返 回 NULL， 但 是 mysql_field_count 返 回 一 个 正 数 ， 你 
可 以 推测 这 是 一 个 提取 错误 。 但 是 ， 如 果 mysql_field_count 返 回 0， 则 表 
示 没 有 列 可 以 提取 ， 这 可 以 解释 为 何 存 储 结果 会 失败 。 我 们 有 理由 认 
为 ， 你 应 该 了 解 一 个 特定 查询 应 返回 的 列 数 。 因 此 ， 对 于 通用 查询 处 理 
模块 或 任何 随意 构造 查询 的 情况 ， 这 个 函数 是 非常 有 用 的 。 

在 为 旧版 本 的 MySQL 所 写 的 代码 中 ， 你 可 能 会 看 到 使 用 

mysgl_num_fields 的 情况 。 它 可 以 接受 一 个 连接 结构 或 一 个 结果 结 

构 指针 作为 参数 ， 并 返回 列 数 。 


如 果 抛 开 对 数据 的 格式 化 不 管 ， 那 么 你 已 经 知道 如 何 立 刻 打 印 出 数 
据 了 。 你 可 以 添加 简单 的 display_row 函 数 到 select2.c 程 序 中 。 


请 注意 ， 为 了 简化 程序 ， 你 把 连接 、 结 果 和 mysql_fetch_row 返 
回 的 行 信息 都 设 为 全 局 的 。 我 们 并 不 建议 在 产品 代码 中 这 样 做 。 


(1) 下 面 是 非常 简单 的 打印 数据 的 代码 : 


ield_count; 


(2) 将 它 添加 到 select2.c 中 ， 并 添加 一 个 声明 和 一 个 函数 调用 : 


void display_row(); 


(3) 现在 ， 把 完成 的 代码 保存 为 select3.c。 最 后 ， 按 如 下 方式 编译 
并 运行 select3: 
5 gcc -I/usr/include/mysql select3.c -L/usr/lib/mysql -lmysgqlclient -o select3 
$ ./select3 


看 来 ， 程 序 可 以 运行 了 ， 虽 然 它 的 输出 不 是 特别 美观 。 但 是 你 并 未 
考虑 结果 中 可 能 出 现 的 NULL 值 。 如 果 想 要 打印 出 更 整洁 的 格式 化 (或 
许 是 表格 化 ) 的 数据 ， 你 需要 同时 得 到 MySQL 返 回 的 数据 和 元 数据 。 
以 使 用 mysql_fetch_field 来 同时 将 元 数据 和 数据 提取 到 一 个 新 的 结 


MYSQL FIELD *mysql fetch field(MYSQL RES *result); 


你 需要 重复 调用 此 函数 ， 直 到 返回 表示 数据 结束 的 NULL 值 为 止 。 
然后 ， 你 可 以 使 用 指向 字段 结构 数据 的 指针 来 得 到 关于 列 的 信息 。 结 构 
MySQL_FIELD 定 义 在 mysql.h 中 ， 如 表 8-12 所 示 。 


表 8-12 


MySQL_FIELD 结 构 中 的 成 员 说 Fi 
har "name: wa i WE. 为 字符 下 
ar “table; 列 所 属 的 表 和 名 ， 当 一 个 查询 要 使 用 到 多 个 表 时 ， 这 将 特别 有 用 。 注 意 ， 
对 于 结 黑 中 可 计算 的 值 如 AX， 它 所 对 颇 的 表 和 名 将 为 空 字符 汕 
如 果 调 用 mysgl_1ist_tields (我 们 未 在 这 呈 介 绍 它 ) ， 它 将 包含 该 列 


的 默认 值 
enum onum field types type: 列 类 型 。 清 查看 紧 站 此 表 的 说 明 
msigned int lengt Sw., Hie Veit 
msigned int max_length; 如 则 使 用 mysql_store_result， 它 将 包 售 以 字 节 为 单位 的 提取 的 最 长 列 
值 的 长 度 ， 如 果 使 用 mysql_wuse_reaulr， 它 将 不 会 被 设置 
flags; KFAELHSS. SHHMORBEA. SLRSHATRBRAL. E 
们 是 : NOT_NULL_PLAG Lh SHED_ELAG. AUTO_INCREMENT_ 


NULI >. PRI_KEY_FLAG. UNSIGNED 
FLAG 和 BINARY_FLAG。 完 整 列表 可 参见 MySQL 文档 


mais 小 数 点 后 的 数字 个 数 ， 仅 对 数字 字段 有 效 


列 类 型 相当 广泛 。 完 整 列表 见 头 文件 mysql_com.h 和 文档 。 和 常见 的 


FIELD_TYPE DECIMAL 
FIELD_TYPE_LONG 
FIELD_TYPE_STRING 
FIELD_TYPE_VAR_STRING 


一 个 特别 有 用 的 预定 义 宏 为 IS_ NUM， 当 字段 类 型 为 数字 时 ， 它 返 
回 true， 像 下 面 这 样 : 


if (IS_NUM(myslq_field_ptr->type)) printf ("Numeric type field\n"); 


FER AY CA, Bi BERT eR: 


MYSQL_FIELD_OFFSET mysql_field_seek(MYSQL_RES *result, 
MYSQL_FIELD_OFFSET offset); 


你 可 以 用 此 函数 来 覆盖 当前 的 字段 编号 ， 该 编号 会 随 每 次 
mysdql_fetch_field 调 用 而 自动 增加 。 如 果 给 参数 offset 传 递 值 0， 你 将 跳 回 
第 一 列 。 

现在 你 得 到 信息 了 ， 你 需要 让 select 程 序 显示 和 某 一 指定 列 相 关 的 
所 有 和 额外 数据 。 

下 面 是 程序 select4.c， 我 们 在 这 里 重新 完整 地 显示 了 整个 程序 的 源 
代码 ， 这 样 你 就 可 以 看 到 一 个 完整 的 例子 了 。 注 意 ， 它 并 没有 试图 对 列 
类 型 进行 详尽 的 分 析 。 


#include <stdlib.h> 
#include <stdio.h> 


include *mysql.h* 


MYSQL my_connection; 
MYSQL_RES *res_ptr; 
MYSQL_ROW sqlrow; 


void display_header({); 
void display_row(); 


int main(int argc, char *argv[]) { 
int res; 


int first_row = 1; /* Used to ensure we display the row header exactly once 
when data is successfully retrieved */ 


myeql_init (&my_connection) ; 
if (mysql_real_connect (amy_connection, “iocalhost", ‘rick’, 
“secret*, *foo*, 0, NULL, 0)) { 
printf ("Connection success\n*); 


res = mysql_query (&my_connection, *SELECT childno, fname, 
age FROM children WHERE age > 5"); 


if (res) { 
fprintf(stderr, “SELECT error: ts\n", mysql_error(&my_connection}); 
} else { 
res_ptr = mysql_use_result (amy_connection) ; 
if (res_ptr) { 
while ((sqlrow = mysql_fetch_row(res_ptr))} { 
if (first_row) { 
display_header {) ; 
first_row = 0; 
} 
display_row(); 


if (mysql_errno(&my_connection)) { 
fprintf(stderr, “Retrive error: ts\n", 
mysql_error(&my_connection) } ; 
) 
mysql_free_result{(res_ptr); 
} 


} 
mysql_close (&my_connection) ; 
} else { 
fprintf(stderr, “Connection failed\n"); 
if (mysql_errno(a&my_connection}) { 
fprintf(stderr, “Connection error td: ts\n", 
mysql_errno(&my_connection), 
myeql_error (4my_connection) }; 
) 
} 


return EXIT_SUCCESS; 
} 


void display_header() { 
MYSQL_FIELD ‘field ptr; 


printf ("Column details:\n"); 

while ({field_ptr = mysql_fetch_fieldires_ptr)) 1= NULL) { 
printf(*\t Name: s\n", field _ptr->name); 
printf("\t Type: *}; 
if (IS_NUM(field_ptr->type)}) { 


printf ("Numeric field\n"); 
} else { 
switch(field_ptr->type) ( 
case FIELD_TYPE_VAR_STRING: 
printf (*VARCHAR\n"); 
break; 
case FIELD_TYPE_LONG: 
printf ("LONG\n"); 
break; 
Gefault 
printf(*Type is td, check in mysql_com.hin", field _ptr->type);: 
} /* switch */ 
} /* else */ 


printf(*\t Max width @id\n*, field _ptr->length); 
if (field _ptr->flags & AUTO_INCREMENT_FLAG) 
printf(*\t Auto increments\n"); 
printft(*\n"); 
} /* while */ 
) 


void display_row() { 
unsigned int field count; 


field_count = 0; 

while (field_count < mysql_field_count (&my_connection)) { 
if (sqlrow{fielid_count]) printf£(*ts *, sqlrow[field_count 
else printf (*NULL"); 
field _count+¢; 

} 

printf (*\n"); 


编译 并 运行 此 程序 时 ， 你 得 到 的 输出 为 : 


$ Ee 
Connection success 


Column details: 


Name hildn 
Type ric fi 
Max 11 

Aut ene 
Name: fname 

Type: VARCHA 
Max h 


这 仍然 不 是 很 漂亮 ， 但 它 很 好 地 阐明 了 如 何 通过 同时 处 理 原 始 数据 
和 元 数据 来 更 有 效 地 使 用 数据 。 

你 还 可 以 通过 其 他 一 些 函 数 来 提取 字段 数组 并 在 列 间 进 行 跳 转 。 但 
通常 你 需要 使 用 的 所 有 例 程 都 在 这 里 介绍 了 ， 感 兴趣 的 读者 也 可 以 在 
MySQL 手 册 中 找到 更 多 信息 。 


8.3.4 JPK% 


表 8-13 中 显示 了 其 他 一 些 我 们 建议 你 了 解 的 API 函 数 。 一 般 情 况 
下 ， 到 目前 为 止 介绍 的 所 有 函数 对 于 实现 一 个 可 工作 的 程序 已 足够 了 ， 
但 是 ， 你 将 会 及 现下 面 这 个 挑选 过 的 列表 也 很 有 用 。 


表 8-13 
示例 API 调 用 ae 
t_chient_inf 了 返回 客户 端 使 用 的 库 的 版 本 信息 
返回 服务 器 连接 信息 
ar *myaql_get_server_info(MySQL *connect lon) ; 返回 当前 连接 的 服务 器 的 信息 


返回 最 近 热 行 的 查询 的 信息 ， 伍 是 仅仅 只 对 一 些 查 询 
HS AS TT 通常 是 YNSERT 和 GDATE 语 多， 否则 返回 


RAPT MARR. WHER SH be 
指定 的 数据 库 。 成 功 时 返回 0 


mysqi_shutcown (MySQL *connect ion, enum 如 果 用 户 虱 有 合适 的 权限 ， 则 关闭 连接 的 数据 库 服务 
人 路 .目前 关闭 级 别 必 须 被 设置 为 SHUTDOWRLDEFAULT， 成 
he eo 


8.4 CD NY HA FE 


现在 ， 你 将 看 到 如 何 创建 一 个 简单 的 数据 库 来 保存 CD 唱片 的 信 
恩 ， 然 后 编写 一 些 代 码 来 访问 这 些 数据 。 为 尽量 保持 代码 的 人 简单， 使 其 
易于 理解 ， 你 将 仅仅 使 用 3 个 数据 库 表 ， 而 且 它 们 之 间 的 关系 也 非常 简 


首先 ， 创 建 一 个 新 的 数据 库 ， 然 后 将 其 作为 当前 的 数据 库 


O 
TI > create database blpcd; 


use blpcd 


现在 ， 你 已 准备 好 设计 和 创建 你 需要 的 表 了 。 

这 个 例子 会 比 以 前 的 稍微 复杂 一 点 ， 因 为 你 将 把 CD 唱片 分 成 3 个 不 
同 的 元 素 : 艺术 家 或 组 合 ) 、 主 标题 和 曲目 。 如 果 考 虑 到 一 套 CD 收 
藏 以 及 它 的 组 成 元 素 ， 你 会 意识 到 每 张 CD 都 由 不 同 的 曲目 组 成 ， 但 不 
同 CD 之 间 又 在 许多 方面 相互 关联 : 通过 艺术 家 或 组 合 、 通 过 制作 公 
司 、 通 过 音乐 表现 风格 等 。 

如 果 试 图 以 一 种 灵活 的 方式 来 保存 所 有 这 些 不 同 的 元 素 ， 你 的 数据 
库 将 变 得 相当 复杂 ， 但 在 本 例 中 ， 你 将 仅 限 于 使 用 两 种 最 重要 的 关系 。 

首先 ， 每 张 CD 由 不 同 数目 的 曲目 组 成 ， 所 以 你 将 把 曲目 数据 储存 
在 一 个 独立 于 其 他 CD 数据 的 表 中 。 其 次 ， 每 位 艺术 家 (或 乐队 ) Aw 
会 有 多 张 专辑 ， 所 以 只 将 艺术 家 的 信息 存储 一 次 ， 然 后 单独 提取 属于 该 
艺术 家 的 所 有 CD 是 非常 有 用 的 。 我 们 不 会 尝试 将 乐队 拆 分 成 不 同 的 艺 
术 家 (乐队 的 每 个 成 员 可 能 都 有 属于 自己 的 专辑 ) 或 处 理 合集 CD 一 一 
这 是 为 了 尽量 保持 例子 的 简单 ! 

同样 ， 你 也 需要 保持 关系 的 简单 一 一 每 个 艺术 家 (也 可 能 是 乐队 名 
称 ) 可 能 制作 一 张 或 多 张 CD， 每 张 CD 包 含 一 个 或 多 个 曲目 。 这 种 关系 
如 图 8-8 所 示 。 


CD 唱片 


图 8-8 


8.4.1 创建 表 


现在 ， 你 需要 确定 表 的 实际 结构 。 我 们 从 主 表 一 -CD 表 开 始 ， 它 
保存 大 部 分 的 信息 。 你 需要 保存 一 个 CD ID、 一 个 分 类 号 、 一 个 标题 以 
及 一 些 你 自己 的 标注 。 你 还 需要 一 个 来 自 artist 表 的 ID 号 来 表明 是 哪 位 艺 
术 家 制作 了 这 张 专辑 。 

artist 表 很 简单 ， 它 仅仅 保存 艺术 家 的 名 字 和 一 个 唯一 的 艺术 家 ID 
号 。track 表 也 很 简单 ， 你 只 需要 一 个 CD ID 来 表明 曲目 属于 哪 张 CD、 一 
个 曲目 号 和 一 个 曲目 标题 。 

首先 是 CD 表 : 


CREATE TABLE cd 
TST ETE 


这 创建 了 表 cd， 它 包含 下 面 一 些 列 。 
口 id 列 ， 包 含 一 个 自动 增加 的 整数 ， 它 是 表 的 主键 。 
口 最 长 为 70 个 字符 的 title。 


o artist_id， 在 artist 表 中 使 用 的 一 个 整数 。 

DO 最 长 为 30 个 字符 的 catalogue 号 。 

o 最 长 为 100 个 字符 的 notes。 

注意 ， 只 有 notes 列 可 以 为 NULL， 所 有 其 他 的 列 都 必须 含有 值 。 
下 面 是 artist 表 : 


id INTEGER AUT NCREMENT NOT NULL PRIMARY KEY 
VARCHAR(100) NOT NULI 


你 又 有 了 一 个 id 列 和 一 个 艺术 家 name 列 。 
最 后 是 track 表 : 


CREATE TABLE track 
ca id INTEGER NOT NULL 


注意 ， 这 次 你 用 不 同 的 方法 来 声明 主键 。track 表 的 不 寻常 之 处 在 于 
每 张 CD 的 ID 会 出 现 多 次 ， 而 对 于 任何 指定 曲目 的 ID， 例 如 曲目 1， 也 会 
在 不 同 的 CD 中 出 现 多 次 。 但 是 ， 这 两 者 的 结合 将 永远 是 唯一 的 ， 所 以 
T T 这 被 称 为 是 联合 键 ， 因 为 它 由 多 列 联 

将 这 些 SQL 语 名 存储 在 文件 create_table.sql 中 ， 并 将 该 文件 保存 在 当 
前 目录 中 ， 然 后 开始 创建 数据 库 及 其 中 的 表 。 当 这 些 表 已 存在 时 ， 我 们 
提供 的 脚本 样 例 还 包含 额外 的 命令 用 于 丢弃 这 些 表 ， 但 默认 情况 下 ， 这 
些 命 令 是 被 注释 掉 的 。 


$ mysql -u rick -p 
Enter password: 


mysql> use blpced; 


yeql> \. create_tables.sql 


注意 我 们 使 用 \. 命 令 将 create_tables.sql 文 件 作为 输入 。 

你 也 可 以 使 用 MySQL 查 询 浏 览 嚣 (MySQL Query Browser) ， 通 过 
执行 SQL 或 简单 地 输入 数据 来 创建 表 。 

一 旦 创建 好 表 ， 你 就 可 以 通过 MySQL 管 理 器 (MySQL 
Administrator) 来 查看 它 ， 如 图 8-9 所 示 。 在 图 中 ， 你 正在 检查 blpcd 数 据 


库 的 indices 标 签 〈 或 schema， eae 


iB Server nlormation assis nies | ens Stared PR 
iC) Senice Control | 
> 5 Mee 
J Startup Parameters Al exces in schema biped 
Ad ner SFE die Name/Comn Name index Type Unique Ma Allowed Seq fider Collation 
W Server Comections B artist PRIMARY RTREF UNIQUE 
tg Health ou 1 aac ering 
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你 可 以 通过 选择 编辑 表 (在 Tables 标 签 中 右键 单 击 或 双击 表 名 ) 看 
到 列 的 话 细 信 息 。 如 图 8-10 所 示 。 


Table Editor 
Table Name: [track Comment: InnoDB free: 4096 KB 
At ee 
“Couns and Indices ‘Table Options |Advanced Options 


Column Name Data Type Sf S Flags Default Value Comments 
? cold INTEGER ® ií 
7 track Wd INTEGER @ © 
È title VARCHARITO) O O 


Column Detals indices Foreign Keys 


x crt Gers) | vay cores | [ow] 


图 8-10 


你 注意 到 图 8-10 中 针对 cd_id 列 和 track_id 列 的 两 个 关键 符号 了 吗 ? 
它 表示 这 两 个 列 都 属于 联合 主键 。 曲 目标 题 可 以 为 NULL (注意 NOT 
NULL 并 没有 被 选中 ) 表示 我 们 允许 CD 曲目 没有 标题 ， 这 种 情况 虽然 少 
见 ， 但 并 非 不 会 出 现 。 


8.4.2 ”添加 数据 


现在 ， 你 需要 添加 一 些 数据 。 最 好 的 检查 数据 库 设计 的 方法 是 ， 添 
加 一 些 样本 数据 并 检查 它们 是 否 都 能 正常 工作 。 

我 们 在 这 里 将 仅仅 展示 一 个 测试 输入 数据 的 例子 ， 因 为 所 有 的 输入 
都 基本 相似 一 一 它们 仅仅 是 加 载 不 同 的 表 ， 所 以 它 并 不 是 理解 发 生 何事 
的 关键 。 下 面 有 两 个 要 点 需要 注意 。 

Oo 这 个 脚本 将 删除 任何 已 有 的 数据 以 确保 脚本 是 干净 的 。 

O 在 ID 字 上 段 中 插入 数值 ， 而 不 是 让 AUTO_INCREMENT 来 自动 分 

配 。 在 这 里 这 样 做 会 更 安全 ， 因 为 不 同 的 插入 操作 需要 知道 哪些 值 

已 被 使 用 以 确保 数据 关系 是 完全 正确 的 ， 因 此 最 好 强制 指定 数值 ， 

而 不 是 允许 AUTO_INCREMENT 函 数 来 自动 分 配 数 值 。 

这 个 文件 叫做 insert_data.sql， 它 可 以 使 用 你 前 面 见 到 的 \. 命 令 来 执 


接 独 是 专辑 中 剩 下 的 曲目 ， 然 后 是 下 一 张 专辑 : 


l 


, track id, title) values(2, 2 
rack_id, title) Values | 
we. 


Age 
Vv ee a 


rere 


直到 最 后 的 曲目 
接着 将 它 保存 为 pop_tables.sql， 并 像 前 面 那 样 在 mysql 提 示 符 下 用 \. 
命令 执行 它 。 

注意 在 cd 5 (I Giorni) 曲目 3 中 ， 曲 目 m un’altra vita'P A fik 

号。 为 了 将 其 插入 到 数据 库 中 ， 你 必须 用 反 和 斜 杜 O 来 引用 撤 

=a 

现在 是 时 候 检查 你 的 数据 是 否 合理 了 。 你 可 以 使 用 mysql 命 令 行 客 
人 首先 ， 从 数据 库 中 选 出 每 张 专辑 的 头 
两 H: 


rack* FROM artist, cd, track WHERE artist. id = cã.artist_id AND trac 


如 果 在 MySQL 查 询 浏览 器 中 尝试 这 个 SQL 语 句 ， 你 可 以 看 到 提取 出 
的 数据 很 好 ， 如 图 8-11 所 示 。 
这 个 SQL 语 句 看 起 来 很 复杂 ， 但 是 如 果 你 将 该 语句 分 解 开 来 看 ， 它 
就 不 是 那么 难 理解 了 。 
先 忽略 SELECT 命令 中 的 AS 部 分 ， 第 一 部 分 仅仅 是 : 
SELECT artist.name, cd.title, track.track_id, track.title 


它 只 是 通过 使 用 标记 tablename.column 来 说 明 你 想 要 显示 哪些 列 。 
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图 8-11 


SELECT 语句 的 AS 部 分 SELECT artist .name, cd. title AS “CD 
ee a a a 
因此 ， 来 自 cd 表 的 tite 列 Ccd.title) 的 标题 栏 被 命名 为 “CD Title”, 
track.title 列 被 命名 为 “Track”。AS 的 使 用 给 了 我 们 更 友好 的 输出 ， 它 是 
在 命令 行 中 针对 SQL 语 句 的 一 个 有 用 的 字句 ， 但 当 你 通过 其 他 编程 语言 
来 调用 SQL 语 句 时 ， 你 几乎 不 会 用 到 它 。 

接 下 来 的 部 分 也 非常 地 简单 易 刷 ， 它 告诉 服务 占 你 使 用 的 表 名 : 


FROM artist, cd, track 
WHERE ei RM bead Hye 


第 一 部 分 AETIA Bertin HF HOTT a nein id 相同 。 记 
住 ， 你 仅仅 保存 了 一 次 艺术 家 的 名 字 并 在 CD 表 中 使 用 ID 来 引用 它 。 下 
一 部 分 ，track.cd id = cd.id， 为 表 track 和 cd 做 同样 的 事情 ， 即 告诉 服务 
器 track 表 的 cd_id 列 应 与 cd 表 中 的 id 列 相同 。 第 三 部 分 ， 
track.track_id<3， 减 少 了 返回 数据 的 数量 以 使 得 你 仅仅 从 每 张 CD 中 得 到 
曲目 1 和 曲目 2。 最 后 ， 你 使 用 AND 把 3 个 条 件 结合 起 来 ， 因 为 你 想 让 这 3 
个 条 件 同 时 都 为 真 。 


BALI SEA HE TEAS Bt P i i GUI 0 EM E 
专心 于 编写 一 个 接口 文件 ， 从 而 允许 你 以 一 种 合理 而 又 简单 的 方式 通过 
C 语 言 来 访问 数据 。 编 写 这 类 代码 的 一 个 常见 问题 是 无 法 知道 返回 的 结 
果 数 ， 以 及 如 何在 客户 端 代码 和 访问 数据 库 的 代码 间 传 递 这 些 结果 。 在 
这 个 应 用 程序 中 ， 为 了 保持 简单 并 专注 于 数据 库 接口 (这 是 代码 中 的 重 
要 部 分 ) ， 我 们 将 使 用 固定 大 小 的 结构 。 但 在 实际 的 程序 中 ， 这 可 能 是 
不 能 接受 的 。 一 种 常见 的 解决 方法 〈 它 同时 也 有 助 于 减少 网 络 流量 ) 是 
每 次 总 是 提取 一 行 数 据 ， 正 如 你 在 本 章 前 面 看 到 的 函数 mysql_use_result 
和 mysql_fetch_row 一 样 。 

1. 接 口 定 义 

我 们 先 从 头 文件 app_mysqlh 开 始 ， 它 定义 了 结构 和 函数 : 

首先 是 一 些 结构 : 


一 一 


etruce 


ucture represent the current CD, excluding the track 
n ati 
cu nt -cd st 
art id; 
ca_ 
char artist na 0 
ch ti [100] 
ca ogue[l 
A plistic tré k det 
irrer st 
id; 
rack 
i MAX_CD_RE ] 
d_search 
id [MAX_< JL 


然后 是 一 对 函数 ， 它 们 用 于 连接 数据 库 以 及 从 数据 库 断 开 连 接 : 


现在 ， 我 们 转向 操纵 数据 的 函数 。 注 意 ， 没 有 创建 或 删除 艺术 家 的 
函数 。 你 将 在 后 台 实现 它 ， 根 据 需要 创建 艺术 家 条 目 ， 然 后 当 它 们 不 再 
被 任何 专辑 使 用 的 时 候 将 其 删除 。 


Functi adding 


add_ arti shar *title, char *catalogue, int *cd_id 
a act rent_tracxs_st *track 
un ns ind trieving >? 
find_cds ( *se struct cd_search_ ult 
ge (i id rent_cd_s dest 
get_cd_ int & cur _tr = 
Fun leti = 
de cd_i 


搜索 函数 相当 通用 : 你 传递 一 个 字符 串 ， 然 后 它 将 在 artist、title 或 
catalogue 条 目 中 搜索 该 字符 串 。 

2. 测 试 应 用 程序 接口 

在 实现 接口 之 前 ， 你 将 编写 一 些 代 码 来 使 用 它 。 这 看 起 来 可 能 有 点 
奇怪 ， 但 在 开始 实现 接口 之 前 了 解 一 下 它 将 如 何 运转 通常 是 个 好 方法 。 

下 面 是 app_test.c 的 源 代 码 。 首 先是 一 些 includes 和 structs: 


#include <stdlib.h> 
#include <stdio.h> 


#include <string.h> 
Sinclude ‘app mysql .h”* 
nt mai 


struct current_cd_st cd; 
struct cd search st cd_res; 
truct current_tracks_st ct 


id; 


”应 用 程序 要 做 的 第 一 件 事 始终 是 ， 初 始 化 一 个 数据 库 连接 并 提供 一 
个 正确 的 用 户 名 和 密码 (一 定 要 用 自己 的 用 户 名 和 密码 ): 


database_start("rick", "secret"); 


然后 ， 测 试 添加 一 张 CD: 


res = add_cd("Mahler“, "Symphony No 1", "4596102", &cd_id); 
printf("Result of adding a cd was $d, cd_id is td\n", res, cd_id); 


memset(&ct, 0, sizeof(ct)); 

ct.cd_id = cd_id; 

strepy(ct.track(0)], "Langsam Schleppend") ; 
strepy(ct.track[1], "Kraftig bewegt"); 

strcpy ({ct.track[2), "Feierlich und gemessen"); 
strepy(ct.track[3], "Sturmisch bewegt"); 
add_tracks(&ct); 


现在 ， 搜 索 CD， 并 从 找到 的 第 一 张 CD 中 提取 信息 : 


res = find_cds("Symphony", &cd_res); 
printf("Found %d cds, first has ID d\n", res, cd_res.cd_id[0]); 


res = get_cd(cd_res.cd_id[0}, &cd); 
printf ("get_cd returned td\n", res); 


memset(&ct, 0, sizeof(ct)); 
res = get_cd_tracks(cd_res.cd_id[(0), &ct); 
printf("get_cd_tracks returned %d\n", res); 
printf ("Title: s\n", cd.title); 
i = 0; 
while (i < res) { 

printf("“\ttrack %d is ts\n", i, ct.track[i]); 


1+¢; 


} 
最 后 ， 删除 CD: 
res = delete_cd(cd_res.cd_id[0]); 
printf("Delete_cd returned %d\n", res); 


然后 断 开 连接 并 退出 : 


database_end(); 


return EXIT SUCCESS; 


3. 实 现 接口 

现在 是 最 困难 的 部 分 ， 实现 你 指定 的 接口 。 这 些 都 包含 在 文件 
app_mysq1.c F. 

首先 是 一 些 基 本 的 includes、 你 需要 的 全 局 连接 结构 和 一 个 标志 
dbconnected， 你 将 使 用 它 来 确保 程序 不 会 在 没有 建立 连接 的 情况 下 尝试 
访问 数据 。 你 还 使 用 一 个 内 部 函数 get_artist_id 来 改善 代码 的 结构 。 


#include <stdlib.h> 
#include <stdio.h> 
#include <string.h> 


#include "“mysql.h" 
#include “app_mysql.h" 


static MYSQL my_connection; 
static int dbconnected = 0; 


static int get_artist_id(char *artist); 
连接 到 一 个 数据 库 是 非常 简单 的 ， 就 像 你 在 本 章 前 面 看 到 的 那样 。 
断 开 连接 就 更 加 简单 了 : 


int database_start(char *name, char *pwd) { 


if (dbconnected) return 1; 


mysql_init(&my_connection); 
if (!mysql_real_connect (&my_connection, "localhost", name, pwd, “blpcd*, 0, 
NULL, 0)) { 
fprintf(stderr, "Database connection failure: td, ts\n", 
mysql_errno(&my_connection), mysql_error (&my_connection) ) ; 
return 0; 
} 
dbconnected = 1; 
return 1; 


} /* database start */ 


void database _end() 1 
if (dbconnected) mysql_close(&my_connection) ; 
dbconnected = 0; 

} /* database_end */ 


现在 通过 函数 add_cd 开 始 真正 的 工作 。 首 先 需 要 给 出 一 些 声明 和 进 
行 健全 性 检查 以 确保 你 已 连接 到 了 数据 库 。 你 将 在 所 有 编写 的 可 外 部 访 
问 的 函数 中 看 到 这 一 切 。 

记 住 ， 我 们 说 过 代码 将 自动 关注 艺术 家 的 名 字 : 


一 


int add_cd(char *artist, char *title, char *catalogue, int *cd_id) 


MYSQOL_RES *res_ptr; 
MYSQL_ROW mysqlrow; 


int res; 

char is[(250]; 
char es(250]; 
int artist_id = 
int new_cd_id = -1; 


t; 


if (!dbconnected) return 0; 
下 一 步 是 检 枉 艺术 家 是 否 已 经 存在 ， 如 末 不 仓 在 ， 你 束 创 建 一 个 。 
这 些 都 由 函数 get_artist_id 来 实现 ， 你 将 在 稍 后 看 到 该 函数 。 


artist_id = get_artist_id(artist) ; 


在 有 了 一 个 artist_id 之 后 ， 你 可 以 插入 主 CD 记 录 了 。 注 意 ， 我 们 使 
用 mysql_escape_string 来 保护 CD 标题 中 的 任何 特殊 字符 。 
mysql_escape_string(es, title, strlen(title)); 
sprintf(is, “INSERT INTO cd(title, artist_id, catalogue) 
VALUES ('%s', $d, '%s')", es, artist_id, catalogue); 
res = mysql_query (&my_connection, is); 
if (res) { 
fprintf(stderr, “Insert error %d: %s\n", 
mysql_errno(&my_connection), mysql_error(&my_connection) ) ; 
return 0; 
} 
当 你 为 此 CD 添加 曲目 时 ， 你 需要 知道 插入 CD 记录 时 使 用 的 ID。 你 
把 此 列 设 置 为 自动 增加 列 ， 因 此 数据 库 会 自动 分 配 ID， 但 是 你 需要 明确 
地 提取 数值 。 这 可 以 通过 使 用 你 在 本 章 前 面 见 到 的 特殊 函数 
LAST_INSERT_ID 来 完成 。 


res = mysql_query(&my_connection, “SELECT LAST_INSERT_ID()"); 
if (res) { 
printf ("SELECT error: s\n", mysql_error(&my_connection) ); 


return 0; 
} else { 

res_ptr = mysql_use_result (&my_connection) ; 

if (res_ptr) { 
if ((mysqlrow = mysql_fetch_row(res_ptr))) { 
sscanf(mysgqlrow[0], "$d", &new_cd_id); 
} 
mysql_free_result(res_ptr); 

} 


你 不 必 担 心 其 他 客户 端 同时 插入 CD 时 会 导致 ID 混乱 ，MySQL 会 基 


于 每 个 客户 的 连接 来 跟踪 分 配 的 ID， 所 以 即使 你 在 提取 ID 之 前 有 另 一 个 
程序 插入 了 一 张 CD， 你 仍然 可 以 得 到 对 应 于 你 的 行 的 ID, 而 不 是 由 其 他 
程序 插入 的 行 所 对 应 的 ID。 
最 后 ， 设 置 新 加 入 行 的 ID 并 返回 成 功 或 失败 : 
*cd_id = new_cd_id; 
1f (new_cd_id != -1) return 1; 
return 0; 
} 
} /* add _ cd */ 
现在 ， 让 我 们 看 一 下 get_artist_id 的 实现 ， 其 过 程 跟 插入 CD 记录 非 
常 相似 : 
/* Find or create an artist_id for the given string */ 
static int get_artist_id(char *artist) { 


MYSOL_RES *res_ptr; 
MYSQL_ROW mysqlrow; 


int res; 
char qs[250]; 
char is[250]; 


char es[250]; 
int artist_id = -1; 


/* Does it already exist? */ 
mysql_escape_string(es, artist, strlen(artist)); 
sprintf (qs, *SELECT id FROM artist WHERE name = ‘ts'*, es); 


res = mysql_query (&my connection, q5}; 
if {res} ( 
fprintf(stderr, "SELECT error: s\n”, mysql_error(&my_connection) ); 
} else { 
res_ptr = mysql_store_result (&my_connection) ; 
if (res_ptr) [( 
if (mysql_num_rows(res_ptr) > 0) ( 
if (mysqlrow = msysqi_fetch_row(res_ptr)) { 
sscanf(mysqlrow[0}, "td", &artist id); 
} 
) 
mysql_free_result (res_ptr); 
) 
} 
if (artist_id != -1) return artist_id; 


sprintf lis, "INSERT INTO artist(name) VALUES({'ts')", es); 
res = mysql_query témy connection, is); 
if (res) { 
fprintf(stderr, "Insert error td: ts\n*, 
mysql_errno(&my_connection), mysql_error(&my_connection) }; 
return 0; 
} 
res = mysql_query(&my_connection, "SELECT LAST_INSERT_ID({)*);: 
if (res) { 
printf(*SELECT error: ¢s\n", mysql_error (&my_connection) ); 
return 0; 
} else { 
res_ptr = mysql_use_result (amy_connection) ; 
if (res_ptr) { 
if ((mysqlrow = mysql_fetch_row(res_ptr))) { 
sscanft(mysqirow[0}, *td", &artist id); 
} 
mysql_free_result (res_ptr); 
} 
} 
return artist_id; 
} /* get_artist_id */ 


现在 ,继续 添加 CD 的 曲目 信息 。 你 仍然 需要 保护 曲目 标题 中 的 特殊 
字符 : 
int add_tracks(struct current_tracks_st *tracks) { 


int res; 
char is[250]; 
char es[250]; 


int i; 


if (!dbconnected) return 0; 


ile (tracks->track[ij{0}} { 

nysql_escape_string(es, tracks->track[i], strlen(tracks->track[i]})); 
sprintf(is, “INSERT INTO track(cd_id, track_id, title) 

VALUES (@d, $d, ‘%s')", tracks->cd_id, i + 1, es): 

res = mysql_query (&my_connection, is); 

if (res) { 


fprintf(stderr, “Insert error $d: %s\n", 
mysql_errno(&my_connection), mysql_error(&my_connection) }; 
return 0; 


i++ 


return l; 


} /* add_tracks * 


现在 ， 根 据 给 定 的 CD 的 ID 值 来 提取 CD 信息 。 你 将 使 用 一 个 数据 库 
联合 在 提取 CD 信息 的 同时 提取 艺术 家 的 ID。 这 是 很 好 的 练习 : 数据 库 
擅长 于 了 解 如 何 高 效 地 执行 复杂 查询 ， 所 以 如 果 一 个 任务 可 以 仅仅 通过 
SQL 语句 就 能 让 数据 库 来 完成 ， 就 决 不 要 自己 来 编写 程序 代码 。 这 样 不 
仅 可 以 节省 自己 的 精力 ， 不 必 编 写 额 外 的 代码 ， 而 且 通 过 让 数据 库 尽 可 
能 多 地 完成 复杂 工作 ， 也 可 以 提高 程序 的 执行 效率 。 


int get n did, struct current_cd_st *dest) { 
MY! res_ptr 
MYSQL_ROW mysqlrow 


char qs[250); 


£ (!dbconnected) return 0; 
memset(dest, 0, sizeof(*dest)); 
dest->artist_id = -1 


sprintfi(qs, “SELECT artist.id, cd.id, artist.name, cd.title, cd.catalogue ' 


FROM artist, cd WHERE artist.id = cd.artist_id and cd.id = %d", ecd_id); 


res = mysql_query(&my_connection, qs); 
if (res) { 


"SELECT 


fprintf(stderr, *SELE error: ts\n", mysql_error(&my_connection) ); 
res_ptr mysql_store_result (&my_connection) ; 
if (mysql_num_rows{res_ptr) > 0) { 


= mysql_fetch_row(res_ptr)) { 
ysq 
, “td*, &dest->artist_id); 


}. "td", &dest->cd_id); 
artist_name, mysqlrow[2]); 
titie, mysqlrow[3]); 

yy (dest->catalogue, mysqlrow[4)]); 


} 
if (dest->artist_id != -1) return 1; 
return 0; 

} /* get_cd */ 


接 下 来 ， 你 要 实现 曲目 信息 的 提取 。 注 意 ， 你 通过 SQL 语句 中 指定 
一 个 ORDER BY 子 句 来 确保 曲目 以 一 个 有 意义 的 顺序 返回 。 而 且 ， 由 数 
据 库 来 完成 这 些 工 作 将 比 我 们 以 任意 顺序 提取 数据 ， 并 自己 编写 代码 来 
排序 更 有 效率 。 


int res; 

char qs(250]; 

int i= 0, num_tracks = 0; 

if (!dbconnected) return 0; 
memset (dest, 0, sizeof(*dest)}; 
dest->cd_id = -1; 


sprintfiqs, "SELECT track_id, title FROM track WHERE track.cd_id = %d \ 
ORDER BY track_id*, cd_id); 


res = mysql_query (&my_connection, qs); 
if (res) { 

fprintf(stderr, “SELECT error: s\n", mysql_error(&my_connection)}; 
} else { 


res_ptr = hii sae store_result (&my_connection) ; 


if (res_ptr 
if ((num_ i = mysql_num_rows(res_ptr > 0) 1 
while (mysqlrow = mysql_fetch_row(res_ptr) ) 1 
strcpy (dest->track[i], mysqlrow[1}) 
i++; 
} 


dest->cd_id = cd_id; 
} 
mysql_free_result(res_ptr); 
} 
} 
return num_tracks; 
} /* get_cd_tracks * 


至 此 ， 现在 是 时 候 搜索 CD 了 。 
你 通过 限制 返回 结果 的 数目 来 保持 接口 的 简单 ， 但 是 你 仍然 想 让 函数 告 
诉 你 共有 多 少 行 ， 即使 这 多 于 你 能 够 提取 的 结果 数 。 


int find_cds(char *search_str, struct cd_search_st *dest) { 
MYSQL_RES *res_ptr; 
MYSQL_ROW mysqlrow; 


int res; 

char Gs [500] ; 
int i = Os 
char ss[250); 


tdbcomnected) return 
ME, EAE RIE RP ARE EB P ORE 
ee sti cep strlenlsearch_str)); 


接着 ， 你 构造 一 个 查询 字符 串 。 注 意 它 需要 使 用 相当 多 的 % 字 符 ， 
因为 % 既 是 SQL 语句 中 用 来 匹配 任何 字符 串 的 字符 ， 也 是 sprintf 中 的 一 
个 特殊 字符 。 


FT EM mTermrorn 


Sk qs, “SELECT DISTINCT artist.id, cd.id FROM artist, cd WHERE artist.id = 
ed.artist_id and (artist.name LIKE ‘8ttstt’ OR cd.citle LIKE ‘t8¢st%’' OR 
cd.catalogue LIKE '$%$%s%%')", ss, ss, ss 


现在 ， 你 可 以 执行 得 询 了 : 


res 


mysql_query (Emy 1, qs); 
es { 
fprint ELECT r: s\n mysqi_error(&my_conne 
else { 
res_ptr J re ult (amy_conne 
if es 
m_r =m l num rowsir pt 
um_row 
wh sql ysq tch_row(res_ptr 4 MAX_CD_RESULT 
anf (mysqlrow[1l è dest d_id[ 
my 2 e. ult ires_ptr 
eturn num rows; 


最 后 ， 你 将 实现 删除 CD 的 方法 。 为 了 符合 我 们 默默 地 管理 艺术 家 
条 目的 策略 ， 当 删除 一 张 CD 时 ， 如 果 没 有 其 他 CD 包含 同一 个 艺术 家 字 
符 串 ， 你 将 删除 这 张 CD 对 应 的 艺术 家 。 奇 怪 的 是 ，SQL 没 有 一 次 从 多 
个 表 中 删除 数据 的 方法 ， 所 以 你 必须 依次 从 每 个 表 中 删除 数据 。 


int delete_cd(int cd_id) { 


int res; 

char gs[250j; 

int artist_id, num_rows; 
MYSQL_LRES *res_ptr; 
MYSQL_ROW mysql row; 


if (!dbconnected) return 0; 


artist_id = -1; 
sprintf(qs, “SELECT artist_id FROM cd WHERE artist_id = 
(SELECT artist_id FROM cd WHERE id = 'td’}*, cd_id); 
res = mysql_query [&my connection, qs); 
if (res) { 
fprintf(stderr, "SELECT error: ts\n", mysql_error(&my_connection)); 


} else { 
res_ptr = mysql_store_result [&my connection); 
if (res_ptr) ( 
num rows = mysql_num_rows(res_ptr) ; 
if (num_rows == 1) { 
/* Artist not used by any other CDs */ 
mysqlrow = mysql_fetch_row(res_ptr); 
sscanf(mysqlrow[{0], "td", &artist_id); 
} 
mysql_free_resultires_ptr): 
} 
) 
sprintf(qs, “DELETE FROM track WHERE cd_id = ‘td'*, cd id); 
res = mysql_query (&my_connection, qs); 
if (res) { 
fprintf{stderr, “Delete error (track} td: %s\n", 
mysql_errno(&my_connection), mysql_error|&my_connection) ) ; 
return 0; 
) 


sSprintf(qs, "DELETE FROM cd WHERE id = ‘td'*, cd id}; 
res = mysql_query (&my_connection, gs); 
if (res) { 
fprintf(stderr, “Delete error (cd) td: ts\n", 
mysql_errno(&my_connection), mysql error (&my_connection) ); 
return 0; 
} 


if (artist_id is -1) { 
/* artist entry is now unrelated to any CDs, delete it */ 
sprintf (qs, "DELETE FROM artist WHERE id = ‘8d'*, artist_id}; 
res = mysql_query (&my_connection, qs); 
if (res) { 
fprintf(stderr, “Delete error (artist) td: ts\n", 
mysql_errno(&my_connection), mysql_error(&my_connection) }; 
} 
} 


这 完成 了 所 有 的 代码 。 
考虑 到 完整 性 ， 我 们 添加 一 个 makefile 文 件 来 使 你 的 工作 更 为 轻 
松 。 你 可 能 需要 根据 MySQL 安 装 的 情况 来 调整 include 路 径 。 


在 后 面 的 章节 中 ， 你 将 看 到 这 个 接口 被 用 于 真正 的 GUI。 人 至 于 现 
在 ， 如 果 你 想 观察 执行 代码 所 引起 的 数据 库 改 变 ， 我 们 建议 你 在 一 个 窗 
口中 运行 gdb 调 试 喜来 单 步 运行 代码 ， 同 时 在 另 一 个 窗口 中 观察 数据 库 
数据 的 变化 。 如 果 使 用 MySQL 查 询 浏 览 占 ,请 记 住 你 需要 刷新 数据 显示 
才能 看 到 数据 的 变化 。 


8.5 小 结 


在 本 章 中 ， 我 们 简要 介绍 了 MySQL。 对 于 经 验 丰 富 的 使 用 者 来 
说 ， 他 们 将 发 现 许 多 我 们 没有 时 间 在 本 章 中 讨论 的 高 级 功能 ， 如 外 键 约 
束 和 触发 器 。 

你 学 习 了 安装 MySQL 的 基础 知识 ， 并 掌握 了 如 何 通过 客户 端 工具 
对 MySQL 数 据 库 进行 基本 的 管理 。 我 们 介绍 了 它 的 C 语 言 API 接 口 ， 这 
是 能 与 MySQL 一 起 工作 的 编程 语言 之 一 。 在 此 过 程 中 ， 你 还 学 习 了 一 
些 SQL 语 句 。 

我 们 希望 本 章 能 够 鼓励 你 开始 尝试 使 用 一 个 基于 SQL 的 数据 库 来 处 
理 数据 ， 并 能 继续 学 习 以 了 解 这 些 强 大 的 数据 库 管理 工具 的 更 多 功能 。 

友情 提示 ，MySQL 的 更 多 信息 可 参见 MySQL 主 页 
www.mysql.com. 


第 9 音 >To 


TE keep, 我 们 将 介绍 一 些 Linux 系 统 中 的 程序 开发 工具 ， 其 中 
一 些 工 具 也 可 以 在 UNIX 系 统 中 使 用 。Linux 系 统 除 提供 开发 人 员 必 需 的 
编译 器 和 调试 右 外 ， 还 提供 一 组 工具 ， 其 中 每 个 都 可 以 完成 一 件 独立 的 
任务 ， 并 且 人 允许 开发 人 员 将 它们 创造 性 地 组 合 在 一 起 ， 而 这 种 组 合 能 力 
也 是 Linux 从 UNIX 的 哲学 体系 中 继承 而 来 的 。 你 将 在 本 章 中 看 到 一 些 非 
ee 并 将 利用 这 些 工具 解决 一 些 实 际 问题 。 这 些 工具 包 
舌 : 
make 命 令 和 makefile 文 件 
使 用 RCS 和 CVS 系 统 对 源 代 码 进 行 控 制 
编写 手册 页 
使 用 patch 和 tar 命 令 来 发 布 软件 
开发 环境 


口 口 口 口 口 


9.1 个 源 文 件 带 来 的 问题 


在 编写 小 程序 时 ， 许 多 人 都 会 在 编辑 完 源 文件 后 重新 编译 所 有 文件 
来 重建 应 用 程序 。 但 对 大 型 程序 来 说 ， 使 用 这 种 简单 的 处 理 方式 会 带 来 
一 些 很 明显 的 问题 。 编 辑 一 编译 一 测试 这 一 循环 的 周期 将 变 长 。 如 果 仪 
改动 了 一 个 源 文件 ， 即 使 是 最 有 耐心 的 程序 员 也 不 想 重 新 编译 所有 的 源 


文件 。 

如 果 在 程序 中 创建 了 多 个 头 文件 ， 并 在 不 同 的 源 文件 中 包含 它们 ， 
这 种 处 理 方式 就 会 带 来 一 个 潜在 的 、 更 严重 的 问题 。 比 如 说 ， 你 有 3 个 
头 文件 ， a.h、b.h 和 c.h,3 个 C 源 文件 main.c、2.c 和 3.c( 我 们 希望 读者 在 实 
际 的 项 目 中 为 源 文 件 选择 更 好 的 名 字 ) ， 具 体 的 情况 如 下 所 示 : 


NC2 UGe @.h* 
Sinclude *b.h* 


#include “b.h* 
#include *c.h* 


如 果 程 序 员 只 修改 了 头 文 件 ch, 则 源 文 件 main.c 和 2.c 无 需 重 新 编 
译 ， 因 为 它们 并 不 依赖 于 这 个 头 文 件 ， 而 对 于 源 文件 3.c 来 说 ， 因 为 它 
含 了 头 文 件 ch, 所 以 在 头 文 件 c.h 改 动 后 ， 就 必须 重新 编译 它 。 但 ， 
改 的 是 头 文 件 b. h, 而 程序 员 叉 态 记 重新 编译 源 文件 2.c, 则 最 终 的 程序 就 可 
能 无 凌 正 党 工作 了 s 
make 工 具 可 以 解决 上 述 这 些 问 题 ， 它 会 在 必要 时 重新 编译 所 有 受 改 
动 影响 的 源 文件 。 


make 命 令 不 仅仅 用 于 编译 程序 ， 无 论 何 时 ， 当 需要 通过 多 个 输 
入 文件 来 生成 输出 文件 时 ,你 都 可 以 利用 它 来 完成 任务 。 它 的 其 他 
用 法 还 包括 文档 处 理 〈 例 如 针对 troff 或 TeX 文 档 〉。 


9.2 make 命令 和 makefile 文 件 


你 将 看 到 ， 虽 然 make 命 令 内 置 了 很 多 智能 机 制 ， 但 光 赁 其 自身 是 无 
法 了 解 应 该 如 何 建立 应 用 程序 的 。 你 必须 为 其 提供 一 个 文件 ， 告 诉 它 应 
用 程序 应 该 如 何 构造 ,这 个 文件 称 为 makefile。 

makefile 文 件 一 般 都 会 和 项 目的 其 他 源 文 件 放 在 同一 目录 下 。 你 的 
机 器 上 可 以 同时 存在 许多 不 同 的 makefile 文 件 。 事 实 上 ， 如 果 管 理 的 是 
一 个 大 项 目 ， 你 可 以 用 多 个 不 同 的 makefile 文 件 来 分 别管 理 项 目的 不 同 
部 分 。 

make 命 令 和 makefile 文 件 的 结合 提供 了 一 个 在 项 目 管理 领域 十 分 强 
大 的 工具 。 它 不 仅 常 被 用 于 控制 源 代 码 的 编译 ， 而 且 还 用 于 手册 页 的 编 
写 以 及 将 应 用 程序 安装 到 目标 目录 。 


9.2.1 makefile} i=} 


makefile 文 件 由 一 组 依赖 关系 和 规则 构成 。 每 个 依赖 关系 由 一 个 目 
标 〈 即 将 要 创建 的 文件 ) 和 一 组 该 目标 所 依赖 的 源 文 件 组 成 。 而 规则 摘 
RU 
行文 件 。 

make 命 令 会 读 取 makefile 文 件 的 内 容 ， 它 先 确 定 目 标 文件 或 要 创建 
的 文件 ， 然 后 比较 该 目标 所 依赖 的 源 文件 的 日 期 和 时 间 以 决定 该 采用 哪 
条 规则 来 构造 目标 。 通 常 在 创建 最 终 的 目标 文件 之 前 ， 它 需要 先 创建 一 
些 中 间 目 标 。make 命 令 会 根据 makefile 文 件 来 确定 目标 文件 的 创建 顺序 
以 及 正确 的 规则 调用 顺序 。 


9.2.2 make 命令 的 选项 和 参半 


make 程 序 本 身 有 许多 选项 ， 其 中 最 常用 的 3 个 选项 如 下 所 示 。 

O -k: 它 的 作用 是 让 make 命 令 在 发 现 错误 时 仍然 继续 执行 ， 而 不 
是 在 检测 到 第 一 个 错误 时 就 停 下 来 。 你 可 以 利用 这 个 选项 在 一 次 操 
作 中 发 现 所 有 未 编译 成 功 的 源 文件 。 

O -n: 它 的 作用 是 让 make 命 令 和 输出 将 要 执行 的 操作 步骤 ， 而 不 真 
正 执行 这 些 操作 。 

oOo -f <filename>: 它 的 作用 是 告诉 make 命 令 将 哪个 文件 作为 
makefile 文 件 。 如 果 未 使 用 这 个 选项 ， 标 准 版 本 的 make 命 令 将 首先 
在 当前 目录 下 查找 名 为 makefile 的 文件 ， 如 果 该 文件 不 存在 , 它 就 会 


查找 名 为 Makefile 的 文件 。 但 如 果 你 是 在 Linux 系 统 中 ， 你 使 用 的 可 

能 是 GNU Make, 这 个 版 本 的 make 命 令 将 在 搜索 makefile 文 件 和 

Makefile 文 件 之 前 ， 首 先 查 找 名 为 GNUmakefile 的 文件 。 按 惯例 , 许 

多 Linux 程 序 员 使 用 文件 名 Makefile, 因 为 如 果 一 个 目录 下 都 是 以 小 

写字 母 为 名 称 的 文件 ， 则 Makefile 文 件 将 在 目录 的 文件 列表 中 第 一 

个 出 现 。 我 们 建议 不 要 使 用 文件 名 GNUmakefile, 因 为 它 是 特定 于 

make 命 令 的 GNU 实 现 的 。 

为 了 指示 make 命 令 创 建 一 个 特定 的 目标 (通常 是 一 个 可 执行 文 
件 ) ， 你 可 以 把 该 目标 的 名 字 作 为 make 命 令 的 一 个 参数 。 如 果 不 这 么 
做 ，make 命 令 将 试图 创建 列 在 makefile 文 件 中 的 第 一 个 目标 。 许 多 程序 
员 都 会 在 上 自己 的 makefile 文 件 中 将 第 一 个 目标 定义 为 al 然后 再 列 出 其 他 
从 属 目标 。 这 个 约定 可 以 明确 地 告诉 make 命 令 ， 在 未 指定 特定 目标 时 ， 
ee 目标 。 我 们 建议 读者 都 坚持 使 用 这 一 约定 。 

1. GAR 

依赖 关系 定义 了 最 终 应 用 程序 里 的 每 个 文件 与 源 文件 之 间 的 关系 。 
在 本 章 前 面 的 程序 示例 中 ， 你 可 以 把 依赖 关系 定义 为 最 终 应 用 程序 依赖 
于 文件 main.o、2.o 和 3.o。 同 样 ，main.o 依 赖 于 main.c 和 ”a.h,2.0 依 赖 于 
2.c、ah 和 b.h,3.o 依 赖 于 3.c、b.h 和 c.h。 因 此 ，main.o 受 文件 main.c 和 a.h 
修改 的 影响 ， 如 果 这 两 个 文件 之 一 有 所 改变 ， 你 就 需要 重新 编译 main.c 
来 重建 main.o。 

在 makefile 文 件 中 ， 这 些 规则 的 写法 是 : 先 写 目标 的 名 称 ， 然 后 紧 
跟着 一 个 冒号 ， 接 着 是 空格 或 制 表 符 tab, 最 后 是 用 空格 或 制 表 符 tab 隔 开 
的 文件 列表 〈 这 些 文 件 用 于 创建 目标 文件 ) 。 与 前 面 例子 相对 应 的 依赖 
关系 列表 如 下 所 示 : 


myapp: main.o 2 


它 表示 目标 myapp 依 赖 于 main.o、2.0 和 3.0, 而 main.o 依 赖 于 main.c 和 
a.h, 等 等 。 

这 组 依赖 关系 形成 一 个 层次 结构 ， 它 显示 了 源 文件 之 间 的 关系。 你 
可 以 很 容易 地 看 出 ， 如 果 文 件 b.h 发 生 改 变 ， 你 就 需 重 新 编译 2.0 和 3.0, 而 
由 于 2.0 和 3.o 发 生 了 改变 ,你 还 需要 重新 创建 目标 myapp。 

如 果 想 一 次 创建 多 个 文件 ， 你 可 以 利用 伪 目 标 all。 假 设 应 用 程序 由 
二 进 制 文件 myapp 和 使 用 手册 myapp.1 组 成 。 你 可 以 用 下 面 这 行 语句 进行 
定义 : 


这 里 再 次 强调 ， 如 果 未 指定 一 个 all 目 标 , 则 make 命 令 将 只 创建 它 在 


文件 makefile 中 找到 的 第 一 个 目标 。 

2. 规则 

makefile 文 件 的 第 二 部 分 内 容 是 规则 ， 它 们 定义 了 目标 的 创建 方 
式 。 在 上 节 的 例子 中 ， 当 make 命 令 确 定 需 要 重建 2.o 时 ， 它 有 具体 应 该 使 
用 哪 条 命令 呢 ? 看 上 去 只 需 使 用 命令 gcc -c 2.c 就 够 了 【在 后 面 你 将 看 
到 ，make 命 令 内 置 了 很 多 默认 规则 ) ， 但 如 果 需 要 指定 头 文 件 目录 ， 或 
者 为 了 今后 的 调试 需要 设置 符号 信息 选项 又 该 怎么 做 昵 ? 这 束 需 要 在 
makefile 文 件 中 明确 定义 一 些 规则 。 


此 时 ， 我 们 必须 提 及 makefile 文 件 中 一 个 非常 奇怪 而 又 令 人 遗 
憾 的 语法 现象 .空格 和 制 表 符 tab 是 有 区 别 的 。 规 则 所 在 的 行 必须 
以 制 表 符 tab 开 涉 ， 用 空格 是 不 行 的 。 由 于 连续 几 个 空格 和 一 个 制 
表 符 tab 看 上 去 很 相似 ， 而 且 几 乎 在 Linux 编 程 的 所 有 领域 中 ， 空 格 
和 制 表 符 tab 之 间 几 乎 没有 差别 ， 所 以 这 样 的 语法 规定 会 带 来 问 
题 。 此 外 ， 如 果 makefile 文 件 中 的 某 行 以 空格 结尾 ， 它 也 可 能 会 导 
致 make 命 令 执行 失败 。 但 这 些 都 是 历史 遗留 问题 ， 而 且 因为 已 有 太 
多 的 makefile 文 件 存在 ， 企 图 将 其 全 部 改正 是 不 现实 的 ， 所 以 请 小 
心 编写 makefile 文 件 。 笠 运 的 是 ， 如 果 缺 少 了 制 表 符 tab,make 命 令 就 
不 会 正常 工作 ， 所 以 发 现 这 个 错误 很 容易 。 


实 验 一 个 简单 的 makefile 文 件 

大 多 数 规则 都 包含 一 个 简单 的 命令 ， 该 命令 也 可 以 在 命令 行 上 执 
行 。 就 前 面 的 例子 来 说 ， 你 把 创建 的 第 一 个 makefile 文 件 命名 为 
Makefile1: 


myapp: main.o 2.0 3.0 
gcc -o myapp main.o 2.0 3.0 


你 在 调用 make 命 令 时 加 上 -f 选 项 ， 这 是 因为 makefile 文 件 并 未 使 用 
常见 的 默认 文件 名 makefile 或 Makefile。 如 果 在 一 个 没有 任何 源 文件 的 目 
录 下 执行 这 个 命令 ， 你 就 会 得 到 如 下 的 输出 结果 : 
$ make -f Makefilel 
make: *** No rule to make rget ‘main.c’, needed by ‘main.o'. Stop. 


make 命 令 假 设 在 makefile 文 件 中 的 第 一 个 目标 myapp 是 想 创 建 的 目 
标 文 件 。 然 后 它 会 检查 其 他 的 依赖 关系 ， 并 确定 需要 有 一 个 名 为 main.c 
的 文件 。 由 于 并 未 创建 该 文件 ，makefile 文 件 里 也 未 说 明 如 何 创建 该 文 
件 ， 所 以 make 命 令 报 告 一 个 错误 。 下 面 束 来 创建 这 些 源 文件 并 重新 进行 
尝试 。 由 于 对 程序 执行 的 结果 没有 兴趣 ， 所 以 这 些 文件 的 内 容 都 非常 简 
单 。 头 文件 实际 上 都 是 空 文件 ， 你 可 以 用 touch 命 令 来 创建 它们 : 


9 touch a.h 
$ touch b.h 
$ touch c.h 


源 文件 main.c 中 包含 main 函 数 ， 该 函数 调用 了 function_ two 和 
function_three 函 数 ， 而 这 两 个 函数 分 别 在 另外 两 个 文件 中 定义 。 源 文件 
通过 攻 nclude 语 句 包含 合适 的 头 文 件 ， 使 它们 看 上 去 依赖 于 这 些 头 文件 
的 内 容 。 它 其 实 算 不 上 是 一 个 应 用 程序 ， 下 面 是 其 程序 清单 : 


main.c */ 
+ 


tion_three(); 


void function_three() { 
} 


再 次 执行 make 命 令 : 


9 make -f Makefilel 

gcc -c main.c 

gcc -C 2.¢ 

geo -c 3.¢ 

gcc -O myapp main.o 2.0 3.0 


9 

这 次 成 功 执行 了 make 命 令 。 

实验 解析 

make 命 令 处 理 makefile 文 件 中 定义 的 依赖 关系 ， 确 定 需要 创建 的 文 
件 以 及 创建 顺序 。 虽 然 把 如 何 创建 目标 myapp 列 在 最 前 面 ， 但 make 命 令 
能 够 自行 判断 出 创建 文件 的 正确 顺序 。 它 调用 你 在 规则 部 分 给 出 的 命令 
来 创建 相应 的 文件 ， 同 时 会 在 执行 时 在 屏幕 上 将 命令 显示 出 来 。 现 在 ， 
你 可 以 测试 在 文件 b.h 改 变 时 ，makefile 文 件 能 否 正确 处 理 这 一 情况 ; 


$ touch b.h 
S make -f Makefilel 


make 命 令 读 取 makefile 文 件 ， 确 定 重 建 myapp 所 需 的 最 少 命令 ， 并 
I le ie eee 
A TAO: 


o myapp main.o 2 


make 命 令 再 次 正确 地 确定 出 需要 采取 的 动作 。 


9.2.3 makefile x 注释 

makefile 文 件 中 的 注释 以 # 守 开头， 一 直 延 续 到 这 一 行 的 结束 。 和 C 
语言 源 文件 中 的 注释 一 样 ， makefile 文 件 中 的 注释 可 以 帮助 程序 的 编写 
者 及 其 他 人 理解 最 初 编写 这 个 文件 的 目的 。 


9.2.4 makefile. VE 


即使 上 述 内 容 就 是 make 命 令 和 makefile 文 件 的 全 部 ， 对 于 管理 包含 
多 个 源 文件 的 项 目 来 说 ， 它 们 仍然 是 强 有 力 的 工具 。 但 是 ， 对 于 管理 包 
含 非常 多 源 文 件 的 大 型 项 目 来 说 ， 它 们 就 显得 过 于 庞大 并 缺乏 弹性 。 
此 ，makefile 文 件 允 许 你 使 用 宏 以 一 种 更 通用 的 格式 来 书写 它们 。 

你 通过 语句 MACRONAME=value 在 makefile 文 件 中 定义 宏 ， 引 用 宏 
的 方法 是 使 用 $$ CMACRONAME) 或 ${MACRONAME}。 make 的 某 些 
版 本 还 接受 $MACRONAME 的 用 法 。 如 果 想 把 一 个 宏 的 值 设置 为 空 ， 你 
可 以 令 等 号 (=) 后 面 留 空 。 

makefile 文 件 中 的 宏 常 被 用 于 设置 编译 器 的 选项 。 在 软件 的 开发 过 
程 中 ， 通 常 开发 人 员 不 会 对 编译 结果 进行 优化 ， 而 是 将 调试 信息 包含 进 
去 。 但 对 于 软件 的 发 行 版 ， 往 往 又 需 反 过 来 做 ， 即 编译 结果 是 一 个 不 包 
含 调试 信息 的 容量 较 小 的 三 进 制 可 执行 文件 ， 使 其 执行 速度 尽 可 能 快 。 

Makefilel 文 件 的 另 一 问题 是 ， 它 假设 编译 器 的 名 字 是 gcc, 而 在 其 他 
UNIX 系 统 中 ， 编 译 器 的 名 字 可 能 是 CC 或 c89。 如 果 想 将 makefile 文 件 移 
植 到 另 一 版 本 的 UNIX 系 统 中 ， 或 在 现 有 系统 中 使 用 另 一 个 编译 器 ， 为 
了 使 其 工作 ， 你 将 不 得 不 修改 makefile 文 件 中 许多 行 的 内 容 。 宏 是 用 来 
收集 所 有 这 些 与 系统 相关 内 容 的 好 方法 ， 通 过 使 用 宏 定义 ， 你 可 以 方便 
地 修改 这 些 内 容 。 

宏 通 和 常 都 是 在 makefile 文 件 中 定义 的 ， 但 你 也 可 以 在 调用 make 命 令 
时 在 命令 行 上 给 出 宏 定 义 ， 例 如 命令 make CC=c89。 命 令 行 上 的 宏 定义 
将 覆盖 在 makefile 文 件 中 的 宏 定义 。 当 在 makefile 文 件 之 外 使 用 宏 定 义 
时 ， 要 注意 宏 定 义 必须 以 单个 参数 的 形式 传递 ， 所 以 应 避免 在 宏 定 义 中 
使 用 空格 或 应 像 下 面 这 样 给 宏 定 义 加 上 引号 : make “CC=c89”。 


实 验 市 宏 定 义 的 makefile 文 件 
下 面 是 makefile 文 件 的 一 个 修订 版 本 Makefile2, 它 使 用 了 一 些 宏 定 
X: 


a ears are include files kept 


ons for development 
Wali -ansi 


ro 
> o 
O et 
aL 
Q 
= 
f; 


i Options for releas 
# CFLAGS a -O -Wal een 


myapp: main.o 2.0 3.0 


$(CC) -o myapp main.o 2.6 3.0 
ma main.c a 
(CC) -I$ (INCLUDE) FLAGS c main 
a.h b.h 
{ I$(IN DE) CFLAGS) 


9: 3.0 beh ch 


-I$ (INCLUDE) $(CFLAGS) -c 3. 


i 除 旧 的 安装 文件 ， 并 通 过 这 个 新 的 makefile 文 件 创 建新 的 安装 文 
件 ， 你 将 看 到 如 下 的 输出 : 


5S rm *.o myapp 
$ make -f Makefile2 


. =g -Wall -ansi -c main.c 
I. -g -Wall -ansi -c 2.c 

I. -g -Wall -ansi -c 3.c 
实验 解析 


make 命 令 将 $ (CC) ~ $ (CFLAGS) 和 $ (INCLUDE ) 替换 为 相 
应 的 宏 定 义 ， 这 与 C 语 言 编 译 器 对 #define 语 句 的 处 理 方式 很 相似 。 现 
在 ， 如 果 想 改变 编译 器 命令 ， 你 只 需 修 改 makefile 文 件 中 的 一 行 即 可 。 

事实 上 ，make 命 令 内 置 了 一 些 特殊 的 宏 定义 ， 通 过 使 用 它们 ， 你 可 
以 让 makefile 文 件 变 得 更 加 简洁 。 我 们 将 几 个 较 常 用 的 宏 列 在 表 9-1 中 ， 
其 使 用 方法 可 以 在 后 面 的 示例 中 看 到 。 这 些 宏 在 使 用 前 才 展 开 ， 所 以 它 
们 的 含义 会 随 着 makefile 文 件 的 处 理 进展 而 发 生变 化 。 事 实 上 ， 如 果 这 
些 内 置 宏 的 用 法 不 是 这 样 ， 它 们 就 没有 什么 用 处 了 。 


表 9-1 

s TT UU cc end NAA 
当前 目标 的 名 学 
“WKR HM + 


PRERA RKA AT 


在 makefile 文 件 中 ， 你 可 能 还 会 看 到 下 面 两 个 有 朋 的 特殊 字符 ， 它 


们 出 现在 命令 之 前 
O -: 告诉 make 命 令 忽略 所 有 错误 。 例 如 ， 如 果 想 创建 一 个 目录 ， 
但 又 想 忽略 任何 错误 《〈 比 如 目录 已 存在 ) ， 你 就 可 以 在 mkdir 命 令 
人 


O @: 告诉 make 在 执行 某 条 命令 前 不 要 将 该 命令 显示 在 标准 输出 
上 。 如 果 想 用 echo 命 令 给 出 一 些 说 明 信 息 ， 这 个 字符 将 非常 有 用 。 


9.2.5 个 目标 


通常 制作 不 止 一 个 目标 文件 或 者 将 多 组 命令 集中 到 一 个 位 置 来 执行 
是 很 有 用 的 。 你 可 以 通过 扩展 makefile 文 件 来 达到 这 一 目的 。 在 下 面 的 
例子 中 ， 你 在 makefile 文 件 中 增加 一 个 clean 选 项 来 删除 不 需要 的 目标 文 
件 ， 增 加 一 个 install 选 项 来 将 编译 成 功 的 应 用 程序 安装 到 为 一 个 目录 
Fs 


实 验 多 个 目标 
下 面 是 makefile 文 件 的 下 一 个 版 本 Makefile3 文 件 的 内 容 : 


这 个 makefile 文 件 中 有 几 处 需要 注意 。 首 先 ， 特 殊 目 标 电 仍然 只 指 
定 了 myapp 这 一 个 目标 。 因 此 ， 如 果 在 执行 make 命 令 时 未 指定 目标 ， 它 
的 默认 行为 就 是 创建 目标 myapp。 

下 一 个 值得 关注 之 处 束 是 两 个 新 增加 的 目标 : clean 和 install。 目 标 
clean 用 rm 命令 来 删除 目标 文件 。rm 命 令 以 减 号 -开头 ， 减 号 的 含义 是 让 
make 命 令 包 略 rm 命令 的 执行 结果 ， 这 意味 着 ， 即 使 由 于 目标 文件 不 存 
在 而 导致 mm 命令 返回 错误 ， 命 令 make clean 也 会 成 功 。 用 于 制作 目标 
clean 的 规则 并 未 给 日 标 clean 定 义 任何 依赖 关系 ， 行 dean: 的 后 面 是 空 
的 ， 因 此 该 目标 总 被 认为 是 过 时 的 ， 所 以 在 执行 make 命 令 时 ， 如 果 指 定 
目标 clean, 则 该 目标 所 对 应 的 规则 将 总 被 执行 。 

目标 install 依 赖 于 myapp, 所 以 make 命 令 知 道 它 必须 首先 创建 myapp， 
然后 才能 执行 制作 该 目标 所 需 的 其 他 命令 。 用 于 制作 instal 目标 的 规则 
由 几 个 shell 脚 本 命令 组 成 。 由 于 make 命 令 在 执行 规则 时 会 调用 一 个 shell, 
并 且 会 针对 每 个 规则 使 用 一 个 新 shell, 所 以 必须 在 上 面 每 行 代码 的 结尾 加 
上 一 个 反 斜 杠 \， 让 所 有 shell 脚 本 命令 在 逻辑 上 处 于 同一 行 ， 并 作为 一 个 
整体 传递 给 一 个 shell 执 行 。 这 个 命令 以 符号 @ 开 头 ， 表 示 make 在 执行 这 
些 规则 之 前 不 会 在 标准 输出 上 显示 命令 本 导 。 

目标 install 按 顺序 执行 多 个 命令 将 应 用 程序 安装 到 其 最 终 位置 。 它 
并 没有 在 执行 下 一 个 命令 前 检查 前 一 个 命令 的 执行 是 否 成 功 。 如 果 这 点 
很 重要 ， 你 可 以 将 这 些 命 令 用 符号 &&& 连 接 起 来 ， 如 下 所 示 : 


h Sorry, $(INSTDIR) does not exist" 


大 家 应 该 记得 ， 我 们 曾经 在 第 2 章 见 过 该 符号 ， 对 shell 来 说 ， 它 
是 “与 ?的 意思 ， 即 每 个 后 续 命 令 只 在 前 面 的 命令 都 执行 成 功 的 前 提 下 才 
会 被 执行 。 在 此 例 中 ， 你 并 不 过 分 关心 前 面 的 命令 是 否 执行 成 功 ， 所 以 
可 以 坚持 使 用 简单 的 格式 。 

你 可 能 不 能 以 普通 用 户 的 身份 将 新 命令 安装 到 目录 /srlocalbin 
下 。 在 执行 命令 make install 之前， 你 可 以 修改 makefile 文 件 以 选择 另 一 
个 安装 目录 ， 或 是 改变 该 目录 的 权限 ， 或 是 通过 命令 su 切换 用 户 身 份 到 
超级 用 户 root。 


5 rm *.o myapp 
$ make -f Makefile3 
1c k; J -Wal -ans -C 


make -f Makefile3 install 
jcc > myapp main.o < 2.0 


Installed ir isr/local/bBin 
$ make -f Makefile} clean 
rm main.o 2.0 3. 


实验 解析 

首先 ， 删 除 myapp 和 所 有 目标 文件 。 单 独 执行 make 命 令 的 话 ， 它 将 
使 用 默认 目标 al 并 创建 可 执行 程序 myapp。 然 后 再 次 运行 make 命 令 ， 但 
因为 myapp 已 经 是 最 新 的 ， 所 以 make 命 令 未 做 任何 事 。 接 下 来 ， 删 除 文 
件 myapp 并 执行 命令 make install, 它 重新 创建 二 进 制 文件 myapp 并 将 其 复 
eS aul 最 后 ， 运 行 命令 make clean 来 删除 当前 目录 下 所 有 的 
目标 文件 。 


9.2.6 yw 


目前 为 止 ， 你 在 makefile 文 件 中 对 每 个 操作 步骤 的 执行 都 做 了 精确 
的 说 明 。 事 实 上 ，make 命 令 本 喘 珊 有 大 量 的 内 置 规则 ， 它 们 可 以 极 大 地 
简化 makefile 文 件 的 内 容 ， 尤 其 在 拥有 许多 源 文件 时 更 是 如 此 。 为 测试 
这 些 内 置 规则 ， 下 面 创建 文件 foo.c 它 是 一 个 传统 的 “Hello World” 程 序 : 


printft("Hello World\n"); 


在 不 指定 makefile 文 件 时 ， 尝 试用 make 命 令 来 编译 它 : 


5 make foo 


A WAS, makem S A BO te i oa eas, HPAL BIA, “eae PEAY 
是 cc 而 不 是 gcc《〈 在 Linux 系 统 中 ， 这 没有 问题 ， 因 为 CC 通常 是 gcc 的 一 
个 连接 文件 ) 。 有 时 ， 这 些 内 置 规则 又 被 称 为 推导 规则 ， 由 于 它们 都 会 
使 用 宏 定 义 ， 因 此 可 以 通过 给 宏 赋予 新 值 来 改变 其 默认 行为 。 


你 可 以 通过 -p 选 项 让 make 命 令 打 印 出 其 所 有 内 置 规则 。 由 于 内 置 规 
则 实在 太 多 ， 不 能 在 此 一 一 列 出 ， 所 以 这 里 只 给 出 了 GNU 版 本 make 的 
make -了 命令 的 部 分 和 输出， 显示 了 其 中 一 部 分 的 规则 : 


TARGET_ARCH C 


考 谍 到 存在 这 些 内 置 规则 ， 你 可 以 将 文件 makefile 中 用 于 制作 目标 
的 规则 去 控 ， 而 只 需 指定 依赖 关系 ， 从 而 达到 简化 makefile 文 件 的 目 
的 。 因 此 该 文件 中 相应 部 分 的 内 容 将 变 得 很 简单 ， 如 下 所 示 : 


3 


读者 可 以 在 本 书 所 对 应 的 网 站 下 载 代码 中 找到 这 个 版 本 的 makefile 
文件 Makefile4。 


9.2.7 A APR IAA 


你 看 到 的 内 置 规则 在 使 用 时 都 利用 了 文件 的 后 缀 名 〈 这 类 似 
Windows 和 MS-DOS 的 文件 扩展 名 ) ， 所 以 当 给 出 带 有 某 个 特定 后 组 名 
的 文件 时 ，make 命 令 知 道 应 该 用 哪个 规则 来 创建 带 有 男 一 个 不 同 后 级 名 
的 文件 。 最 常见 的 一 条 规则 是 用 于 从 一 个 以 .c 为 后 缀 名 的 文件 创建 出 一 
个 以 .o 为 后 级 名 的 文件 。 该 规则 使 用 编译 器 进行 编译 ， 但 并 不 对 源 文件 


进行 链接 。 

有 了 时， 你 需要 自己 创建 新 规则 。 我 过 去 在 日 常 工 作 中 经 和 常 需要 用 多 
个 不 同 的 编译 器 对 源 文件 进行 编译 : 其 中 两 个 是 MS-DOS 下 的 编译 器 ， 
一 个 是 Linux 下 的 gcc。 为 了 让 其 中 一 个 MS-DOS 编 译 占 能 够 正常 工作 ， 
源 文件 (它们 用 的 是 C++ 语 言 而 不 是 C 语 言 ) 需 要 以 .cpp 为 后 级 名 。 但 糟 
料 的 是 ， 那 个 时 候 的 Linux 系 统 下 的 make 版 本 没有 用 于 编译 后 级 名 
为 .cpp 的 源 文件 的 内 置 规则 ( 它 倒是 有 一 条 针对 .cc 源 文 件 的 规则 ， 
UNIX 系 统 中 的 C++ 文件 党 使 用 这 个 后 组 名 ) 。 

为 解决 这 个 问题 ， 或 者 为 每 个 单独 的 源 文件 指定 一 条 规则 ， 或 者 为 
make 制 定 一 条 新 的 规则 ， 专 门 用 于 从 后 缀 名 为 .cpp 的 源 文件 创建 目标 文 
件 。 假 设 这 个 项 目 中 的 源 文件 数量 非常 大 ， 那 么 制定 一 条 新 规则 将 节省 
大 量 的 键入 时 间 ， 也 使 得 为 该 项 目 增加 新 的 源 文 件 变 得 更 加 容易 。 

要 想 增 加 一 条 新 的 后 级 规则 ， 首 先 需 要 在 makefile 文 件 中 增加 一 行 
语句 ， 告 诉 make 命 令 这 个 新 的 后 缀 名 。 然 后 即 可 用 这 个 新 的 后 缀 名 来 定 
义 规 则 。make 使 用 特殊 语法 : 


.<old_suffix>.<new_suffix>: 


.<old_suffix>. <new_suffix> : 

来 定义 一 条 通用 规则 ， 利 用 该 规则 可 以 从 带 有 旧 后 级 名 的 文件 创建 
带 有 新 后 级 名 的 文件 ， 并 保留 原文 件 的 前 半 部 分 。 

下 面 是 makefile 文 件 的 一 个 片段 ， 它 用 一 个 新 的 通用 规则 将 .cpp 文 件 
编译 为 .0 文件 : 


cpp.o 
$ (CFLAGS) ~I${INCLUDE) -c 


特殊 依赖 关系 .cpp.o: 1 YFmake, Z pE # a Hy AU HPO a RA 
为 .cpp 的 文件 转换 为 后 级 名 为 .0 的 文件 。 在 定义 这 个 依赖 关系 时 ， 使 用 
了 特殊 的 宏 名 称 ， 这 是 因为 此 时 你 还 不 知道 将 要 被 转换 的 文件 的 名 字 。 
要 想 理 解 这 条 规则 ， 只 需要 记 住 宏 $< 将 被 扩展 为 起 始 文 件 的 名 字 ( 包 含 
HAJER) 。 注 意 ， 只 需 告 诉 make 如 何 从 .cpp 文 件 得 到 .o 文 件 ，make 
己 经 知道 如 何 从 一 个 目标 文件 得 到 一 个 二 进 制 可 执行 文件 了 。 

当 调 用 make 命 令 时 ， 它 将 使 用 这 条 新 规则 从 bar.cpp 文 件 得 到 bar.o 文 
件 ， 然 后 再 使 用 它 的 内 置 规则 从 .o 文 件 得 到 二 进 制 可 执行 文件 。- 
XC++ 标 志 的 作用 是 告诉 gcc 编 译 器 这 是 一 个 C++ 源 文 件 。 

如 今 的 make 版 本 已 知道 如 何 处 理 后 级 名 为 .cpp 的 C++ 源 文件 了 ， 但 
当 需 要 将 一 种 类 型 的 文件 转换 为 另 一 种 类 型 的 文件 时 ， 这 个 技术 仍然 很 


用 。 
最 新 的 make 版 本 还 包含 一 个 新 的 语法 以 实现 同样 的 效果 ， 而 且 功 能 


更 强大 。 例 如 ， 模 式 规则 可 以 用 % 通 配 符 语法 来 匹配 文件 名 ， 而 不 是 仅 
依赖 于 文件 的 后 级 名 。 
可 以 达到 与 上 例 中 .cpp 规 则 同样 效果 的 模式 规则 如 下 所 示 : 


t.cpp 


xc++ S(CFLAGS I$ (INCLUDE c $< 


9.2.8 make 管 理据 类 


对 于 大 型 项 目 ， 一 种 比较 方便 的 做 法 是 用 函数 库 来 管理 多 个 编译 产 
品 。 函 数 库 实际 上 束 是 文件 ， 它 们 通常 以 .a 〈a 是 英文 archive 的 首 字 母 ) 
为 后 级 名 ， 在 该 文件 中 包含 了 一 组 目标 文件 。make 命 令 用 一 个 特殊 的 语 
法 来 处 理 函 数 库 ， 这 使 得 函数 库 的 管理 工作 变 得 非常 容易 。 

用 于 管理 函数 库 的 语法 是 lib (file.o) , 它 的 含义 是 目标 文件 file.o 是 存 
储 在 函数 库 lib.a 中 的 。 make 命 令 用 一 个 内 置 规则 来 管理 函数 库 ， 访 规则 
的 常见 形式 如 下 所 示 : 


FLAGS) $< 


Z$ CAR) 和 $ CARFLAGS) 的 默认 取 值 通常 分 别 是 命令 ar 和 选项 
rvVv。 这 个 相当 简洁 的 语法 告诉 make, 要 想 从 .c 文 件 得 到 .a 库 文件 ， 它 必须 
应 用 上 面 两 条 规则 。 

O 第 一 条 规则 告诉 它 必须 编译 源 文件 以 生成 目标 文件 。 

Oo 第 二 条 规则 告诉 它 用 ar 命令 将 新 的 目标 文件 添加 到 函数 库 中 。 

因此 ， 如 果 有 一 个 名 为 fud 的 函数 库 ， 其 中 包含 目标 文件 bas.o, 则 第 
一 条 规则 中 的 $< 将 被 蔡 换 为 bas.c, 而 第 二 条 规则 中 的 $@ 和 $* 将 被 分 别 蔡 
换 为 库 文件 fud.a 和 名 字 bas。 


X 验 管理 函数 库 

在 实际 应 用 中 ， 管 理 函数 库 规 则 的 使 用 非常 简单 。 下 面 将 文件 2.0 
和 3.0 放 入 函数 库 mylib.a 中 。 你 只 需 对 makefile 文 件 做 很 少 的 修改 ， 最 终 
的 makefile 文 件 Makefile5 如 下 所 示 : 


ans 
Lox Abr 
MYLIE myli 
myapp: main.o $(MYLIB) 
$(CC) -o myapp main.o $(MYLIB) 


$(MYLIB): $(MYLIB) (2.0) ${MYLIB) (3.0 
© ain h 


xXist*; 


请 注意 ， 我 们 是 如 何 利 用 默认 规则 来 完成 大 部 分 工作 的 。 下 面 测试 
这 个 新 版 本 的 makefile 文 件 : 


5 rm -f myapp *.o mylib.a 
5 make -f MakefilesS 
Jec 了 Wall ansi 


ar rv mylib.a 3.0 


IC -0 myapp main.o 
$ touch c.b 

$ make -f Makefile5 
© -g -Wall -ansi 


实验 解析 

首先 ， 删 除 所 有 的 目标 文件 和 库 文 件 ， 然 后 执行 make 命 令 创 建 
myapp。make 命 令 首 先 编 译 并 创建 函数 库 ， 然 后 把 main.o 和 该 函数 库 链 
接 起 来 以 创建 myapp。 接 下 来 测试 目标 3.0 的 依赖 规则 ， 它 告诉 ”make 命 
令 ， 当 文件 ch 发生 改变 时 ， 源 文件 3.c 必 须 被 重新 编译 。make 命 令 正 确 
地 完成 了 这 一 工作 ， 它 首先 编译 源 文件 3.c, 然 后 更 新 函数 库 ， 最 后 重新 
链接 函数 库 并 创建 一 个 新 的 可 执行 文件 myapp。 


对 于 大 型 的 项 目 ， 有 时 我 们 希望 能 把 构成 一 个 函数 库 的 几 个 文件 从 
主 文件 中 分 离 出 来 ， 并 将 它们 保存 到 一 个 子 目 录 中 。 使 用 make 命 令 完 成 
这 一 工作 的 方法 有 两 个 。 

第 一 个 方法 是 ， 你 可 以 在 子 目 录 中 编写 出 第 二 个 makefile 文 件 ， 它 
的 作用 是 编译 该 子 目 录 下 的 源 文件 ， 并 将 它们 保存 到 一 个 函数 库 中 ， 然 
后 将 该 库 文件 复制 到 上 一 级 的 主 目录 中 。 在 主 目 录 中 的 makefile 文 件 包 
ee 该 规则 会 调用 第 二 个 makefile 文 件 ， 如 
下 所 示 : 


这 就是 说 ， 你 必须 总 是 执行 命令 make mylib.a。 当 make 命 令 调 用 这 
条 规则 来 创建 函数 库 时 ， 它 将 切换 到 子 目录 mylibdirectory 中 ， 然 后 调用 
一 个 新 的 make 命 令 来 管理 函数 库 。 由 于 make 会 针对 每 个 命令 调用 一 个 
新 的 shell, 而 使 用 第 二 个 makefile 文 件 的 make 命 令 本 身 又 并 没有 执行 cd 命 
令 ， 但 它 又 必须 在 一 个 不 同 的 目录 下 创建 函数 库 ， 为 解决 这 一 问题 ， 我 
们 用 括号 将 这 两 个 命令 括 起 来 ， 从 而 确保 它们 只 被 一 个 单独 的 shell 处 
理 。 

第 二 个 方法 是 ， 在 原来 的 makefile 文 件 中 添加 一 些 宏 。 新 添加 的 宏 
通过 在 我 们 已 见 过 的 宏 的 尾部 退 加 一 个 字母 得 到 ,字母 D 代 表 目 录 , 字 母 F 
代表 文件 名 。 然 后 你 就 可 以 用 下 面 的 规则 来 替换 内 置 的 .c.o 后 级 规则 : 


这 条 规则 的 作用 是 : 编译 子 目录 中 的 源 文件 并 将 目标 文件 放 在 该 子 目 录 
中 。 然 后 ， 你 用 如 下 的 依赖 关系 和 规则 来 更 新 当前 目录 下 的 函数 库 : 


mylib.a: mydir/2.0o mydir/3.o 


v myl 


EM H F AEEA AE ERE AY © E H EH T 
目录 ， 但 这 将 导致 在 主 目录 中 存在 大 量 的 源 文 件 。 可 以 从 上 面 的 简介 中 
看 到 ， 你 只 需要 为 makefile 文 件 稍微 增加 一 点 复杂 性 ， 即 可 在 make 命 令 
中 使 用 子 目 录 。 


9.2.10 GNU make 和 gcc 
GNU 的 make 命 令 和 GNU 的 gcc 编 译 器 有 下 面 两 个 有 趣 的 选项 。 


O 第 一 个 选项 是 make 命 令 的 -jN (字母 j 是 英文 单词 jobs 的 首 字 母 ) 
选项 ， 它 允许 make 命 令 同 时 执行 N 条 命令 。 如 末 项 目的 不 同 部 分 可 
以 役 此 独立 地 进行 编译 ，make 命 令 就 可 以 同时 调用 几 条 规则 。 根 据 
系统 的 配置 情况 ， 这 种 做 法 可 以 极 大 地 缩短 重新 编译 所 需要 人 花费 的 
时 间 。 如 果 有 许多 源 文件 ， 这 个 选项 束 值 得 一 试 。 一 般 来 说 ， 你 可 
以 先 从 较 小 的 数字 《比如 -j3) 开始 尝试 。 但 如 果 需 要 与 其 他 用 户 共 
译 你 的 计算 机 ， 束 要 小 心 使 用 这 个 选项 ， 因 为 其 他 用 户 可 能 并 不 豆 
欢 你 每 次 编译 时 都 局 动 大 量 的 进程 。 

O 另 一 个 有 用 的 选项 是 gcc 的 -MM 选项 。 它 的 作用 是 产生 一 个 适用 
于 make 命 令 的 依赖 关系 清单 。 如 末 某 个 项 目 包含 非常 多 的 源 文件 ， 
每 个 源 文 件 又 包含 不 同 的 头 文件 组 合 ， 则 理 清 它们 之 间 的 依赖 关系 
将 非常 困难 《但 又 非常 重要 ) 。 如 果 让 每 个 源 文 件 都 依赖 于 所 有 的 
头 文件 ， 有 时 候 你 就 会 编译 一 些 没有 必要 编译 的 文件 。 但 从 力 一 方 
面 来 看 ， 如 果 忽 略 一 些 依赖 和 关系， 问题 会 变 得 更 严重 ， 因 为 你 没有 
重新 编译 一 些 需 要 编译 的 文件 。 


X 验 gcc-MM 
ge Oe eae ee 
2 清 : : 


5 gcc -MM main.c 2.c 3.c 


实验 解析 

gcc 编 译 器 扫描 源 文 件 以 查找 include 语 句 ， 然 后 以 一 种 适合 于 直接 
插入 到 makefile 文 件 中 的 格式 输出 需要 的 依赖 关系 清单 。 你 只 需 先 把 这 
个 输出 结果 保存 到 一 个 临时 文件 中 ， 然 后 把 它们 插入 到 makefile 文 件 
中 ， 即 可 得 到 一 组 完美 的 依赖 关系 规则 。 如 果 拥 有 gcc 编 译 器 ， 却 还 出 
现 依赖 关系 的 错误 束 不 应 该 了 ! 

如 果 你 对 制作 makefile 文 件 非 常 有 信心 ， 也 可 以 尝试 使 用 
makedepend 工 具 ， 它 的 功能 与 -MM 选项 很 类 似 ， 但 其 做 法 是 将 依赖 关系 
直接 附加 到 指定 的 makefile 文 件 的 末尾 。 

在 结束 对 makefile 文 件 的 介绍 之 前 ， 我 们 有 必要 指出 makefile 文 件 并 
不 仅 用 于 编译 源 代 码 或 创建 函数 库 。 只 要 是 可 以 通过 一 系列 命令 从 某 些 
类 型 的 输入 文件 得 到 输出 文件 的 任务 ， 你 都 可 通过 makefile 文 件 来 自动 
地 完成 。 一 个 典型 的 “ 非 编译 器 ”用途 是 ， 通 过 调用 awk 或 sed 命 令 对 一 些 
文件 进行 处 理 ， 或 甚至 通过 makefile 文 件 来 生成 使 用 手册 。 你 可 以 通过 
它 对 任何 与 文件 操纵 相关 的 任务 进行 目 动 化 处 理 ， 只 要 make 命 令 可 以 根 


据 文件 的 日 期 和 时 间 信 息 判 断 出 哪个 文件 发 生 了 改变 即 可 。 

男 一 种 用 于 控制 程序 创建 或 完成 其 他 自动 化 任务 的 工具 是 ANT。 它 
是 一 个 基于 Java 的 工具 ， 它 使 用 基于 XML 的 配置 文件 。 这 个 工具 并 不 常 
被 用 于 自动 化 处 理 Linux 系 统 上 C 语 言 文 件 的 创建 ， 所 以 我 们 不 会 在 这 里 
对 它 作 进一步 的 介绍 。 你 可 以 通过 网 址 http://ant.apache.org 找 到 有 关 
ANT 的 详细 资料 。 


9.3” 源 代码 控制 


如 果 你 做 的 不 是 一 个 简单 的 项 目 ， 特 别 是 项 目的 开发 人 员 不 止 一 个 
时 ， 为 避免 文件 修改 的 冲突 并 跟踪 对 源 文 件 所 作出 的 修改 ， 对 源 文件 改 
动 方面 的 管理 就 变 得 非常 重要 。 

UNIX 中 有 几 个 被 广泛 使 用 的 用 于 管理 源 文件 的 系统 ， 如 下 所 示 。 

O SCCS: 源 代码 控制 系统 。 

O RCS: 版 本 控制 系统 。 

口 CVS: 并 发 版 本 控制 系统 。 

Ol Subversion. 

SCCS 是 由 AT&T 在 系统 V 版 本 的 UNIX 中 引入 的 最 初 的 源 代码 控制 
系统 ， 现 在 它 已 是 X/Open 标准 的 一 部 分 了 。RCS 是 在 这 之 后 开发 的 ， 它 
作为 SCCS 的 一 个 免费 蔡 换 系统 ， 由 自由 软件 基金 会 发 布 。 RCS 的 功能 
与 SCCS 非 党 类似 ， 但 它 有 着 更 直观 的 接口 和 一 些 其 他 的 选项 ， 所 以 
SCCS 基 本 上 已 被 RCS 所 取代 。 

RCS 工 具 是 Linux 发 行 版 中 的 一 个 常见 套件 ， 你 也 可 以 从 自由 软件 
基金 会 的 网 址 http:/directory.fsf.org/rcs.html 上 下 载 它 及 其 源 代码 。 

CVS 是 一 个 比 SCCS 和 RCS 更 高 级 的 工具 ， 它 用 于 基于 互联 网 的 协 
同 开 发 。 你 可 以 在 大 多 数 Linux 发 行 版 中 找到 它 ， 你 也 可 以 通过 网 址 
http://www.nongnu.org/cvs/ 下 载 它 。 与 RCS 相 比 ， 它 有 两 个 显著 的 优势 : 
可 以 通过 网 络 使 用 ， 并 且 人 允许 并 发 开发 。 

Subversion 是 一 个 新 开发 的 工具 ， 它 则 在 最 终 蔡 换 CVS。 它 的 主页 
是 http://www.subversion.org。 

在 本 章 中 ， 我 们 将 重点 介绍 RCS 和 CVS。 介 绍 RCS 是 因为 它 对 个 人 
的 开发 项 目 来 说 易于 使 用 ， 并 且 它 与 make 整 合 得 很 好 。 介 绍 CVS 是 因为 
它 是 用 于 合作 项 目的 最 和 常见 的 源 代码 控制 形式 。 鉴 于 SCCS 作 为 POSIX 
标准 的 地 位 ， 我 们 还 将 简要 地 比较 RCS 命 令 和 SCCS 命 令 ， 并 对 CVS 和 
Subversion 中 的 一 些 用 户 命 令 进 行 比 较 。 


9.3.1 RCS 


版 本 控制 系统 (RCS) 提供 了 许多 用 于 管理 源 文 件 的 命令 。 它 能 够 
跟 踊 并 记录 下 源 文件 的 每 一 次 改动 ， 并 将 这 些 改动 都 记录 在 一 个 文件 
中 ， 该 文件 中 记录 的 改动 信息 足够 详细 ， 你 可 以 通过 这 些 信息 重 建 出 任 
何 一 个 以 前 的 版 本 。 它 还 允许 你 为 每 次 改动 保存 一 个 与 之 对 应 的 注释 信 
恩 ， 这 对 了 解 文件 改动 的 历史 非常 有 用 。 


随 着 项 目的 进展 ， 你 可 以 将 每 次 对 源 文件 进行 的 大 的 改动 或 漏洞 的 
修补 分 别 进行 记录 ， 并 针对 每 次 改动 保存 注释 。 当 需要 回顾 对 文件 曾经 
做 过 的 改动 、 检 碍 何 时 修补 过 漏 铜 或 何 时 引入 漏 调 时 ， 这 就 非常 有 用 。 

因为 RCS 只 保存 版 本 之 间 的 不 同 之 处 ， 所 以 它 非常 节省 存储 空间 。 
万 一 不 小 心 误 删 了 文件 ，RCS 还 可 以 帮助 你 找 回 以 前 的 版 本 。 


1. rcs 命 令 


为 便于 说 明 ， 我 们 从 一 个 需要 管理 的 文件 的 初始 化 版 本 开始 介绍 。 
在 本 例 中 ， 我 们 使 用 的 文件 为 iImportant.c, 它 实际 上 是 文件 foo.c 的 一 份 副 
本 ， 但 在 文件 的 开头 加 上 了 如 下 的 注释 : 


This is an important file OF managing this project. 
It implements the canonical "Hello World® program. 


第 一 个 任务 是 用 rcs 命 令 来 初始 化 该 文件 的 RCS 控 制 。 命 令 rcs-i 的 作 
用 是 初始 化 RCS 控 制 文 件 。 


res -i important.c 


JOTE Thi is NOT the loo message 
>> This is an important demonstration file 


你 可 以 使 用 多 行 注释 ， 结 束 输入 需要 在 一 行 中 单独 使 用 一 个 英文 名 
F O 或 输入 文件 结束 字符 〈( 通 第 是 组 合 键 Ctrl+D)》。 

执行 完 这 条 命令 后 ，rcs 将 创建 一 个 新 的 只 读 文件 ， 该 文件 的 后 缀 带 
有 ,Vv, 如 下 所 示 : 


nt rt 


如 果 和 希望 能 把 RCS 文 件 保存 到 另 一 个 目录 中 ， 你 只 需 在 第 一 次 
使 用 rcs 命 令 之 前 建立 一 个 名 为 RCS 的 子 目 录 ， 这 样 所 有 的 rcs 命 令 
都 会 目 动 地 把 RCS 文 件 保存 到 该 子 目 录 中 。 
2.Gi 命 令 
现在 可 以 使 用 ci 命令 将 源 文件 的 当前 版 本 “ 签 入 ”(check in) 到 RCS 
中 了 : 


5 ci important.c 
mportant. y ¢-- 


WORSE PUT res-its > T, FET cit SIT, RCSB ERA 
一 段 对 该 文件 的 描述 。 如 果 现 在 查看 目录 中 的 内 容 ， 你 将 会 发 现 文件 
important.c 已 被 删除 : 


$ ls -l 


文件 内 容 及 其 控制 信息 都 已 经 被 保存 到 RCS 文 件 important.c,v 中 
Ta 


3. co 命令 


如 果 想 修改 文件 ， 你 必须 首先 “ 签 出 ”(checkout) 该 文件 。 如 条 只 
是 想 阅 读 该 文件 ， 你 可 以 用 co 命令 重建 当前 版 本 的 该 文件 并 将 它 的 权限 
改 为 只 读 。 如 果 想 对 其 进行 修改 ， 你 就 必须 用 命令 co-1 锁 定 访 文件， 
为 在 一 个 项 目 组 中 ， 必 须 确保 任 一 时 刻 只 有 一 个 人 可 以 修改 指定 的 文 
件 ， 这 也 和 古 指定 版 本 的 文件 只 能 有 一 份 副 本 拥有 写 权 限 的 原因 。 当 文件 
以 可 写 方式 被 <“ 签 出 "时 ， 对 应 的 RCS 文 件 将 被 锁定 。 


5 co -1 important.c 


然后 碍 看 目录 和 内容 : 


Sls -1 


现在 有 了 可 以 进行 编辑 的 文件 ， 你 对 其 进行 修改 ， 把 新 版 本 存盘 ， 
sat 再 次 用 ci 命令 保存 改动 。 现 在 文件 important.c 中 的 输出 部 分 代码 如 
下 所 示 : 


n"); 
extra line added later\n"); 


以 如 下 方式 使 用 ci 命令 : 
$ ci important.c 


importan important.c 


new 


jy message, terminated with single ', or end of fil 


"> Added an extra line to be printed out. 


如 果 想 在 “ 签 入 ”该 文件 时 仍然 保留 文件 的 锁定 状态 ， 使 得 可 以 继续 
对 该 文件 进行 修改 ， 你 就 需要 在 调用 ci 命令 时 加 上 -1 选项 。 这 样 ， 在 签 
入 ”该 文件 的 同时 它 会 被 自动 “ 签 出 ”来 供 同一 用 户 使 用 。 


现在 ， 你 已 保存 了 该 文件 的 修订 版 本 。 如 果 碍 看 目录 内 容 ， 你 就 会 
发 现 文件 important.c 再 次 被 删除 了 : 


5 ls -l 


4. #6 命令 
查看 一 个 文件 的 改动 摘要 通常 是 很 有 用 的 。 你 可 以 用 rlog 命 令 来 完 


$ rlog important.c 


输出 结果 中 的 第 一 部 分 给 出 了 对 该 文件 的 描述 以 及 rcs 使 用 的 选项 。 
接 痢 ，rlog 命 令 列 出 对 该 文件 的 修改 情况 和 你 “ 签 入 ”该 文件 时 输入 的 注 
释 内 容 ， 最 近 的 修改 列 在 最 前 面 。 版 本 1.2 中 的 line:+1 -0 表明 在 这 一 修订 
版 本 中 增加 了 一 行 ， 未 删除 行 。 


注意 ， 文 件 修改 时 间 在 存储 时 不 会 进行 夏令 时 调整 ， 这 是 为 了 
避免 在 改变 时 钟 时 可 能 会 带 来 的 问题 。 
如 末 现 在 想 取出 该 文件 的 第 一 个 版 本 ， 你 可 以 在 调用 co 命令 时 指定 
需要 的 版 本 号 ， 如 下 所 示 : 


co -rl.1 important.c 


ci 命令 也 有 一 个 -选项 ， 它 的 作用 是 强制 指定 主 版 本 号 ， 例 如 命令 ci 
-r2 important.c 将 把 文件 important.c“ 签 入 ”为 版 本 2.1。RCS 和 SCCS 默 认 
都 用 数字 1 作为 第 一 个 次 版 本 号 。 


5. resdiffi 4 


如 果 只 是 想 了 解 两 个 版 本 之 间 的 区 别 ， 你 可 以 使 用 命令 rcsdiff: 


$ resdiff -r1.1 -ri.2 important.c 


lilai2 


上 面 的 输出 结果 表明 在 原文 件 的 第 11 行 后 插入 了 一 行 。 

6. 标识 版 本 

RCS 系 统 可 以 在 源 文件 中 使 用 一 些 特殊 的 字符 串 〈( 宏 〉 来 帮助 跟踪 
文件 所 做 的 改动 。 最 常用 的 两 个 宏 是 $RCSfile$ 和 $Id$。 安 $RCSfile$ 将 
扩展 为 该 文件 的 名 字 ， 而 宏 $Id 将 扩展 为 一 个 标识 版 本 号 的 字符 
串 。RCS 系 统 文 持 的 特殊 字符 串 的 完整 列表 请 得 看 在 线 帮助 手册 。 这 些 
宏 将 在 文件 被 “ 签 出 ”时 扩展 ， 并 且 在 文件 被 “ 签 入 ”时 自动 更 新 。 

下 面 我 们 对 文件 important.c 进 行 第 三 次 修改 ， 增 加 一 些 宏 : 


$ co -1 important.c 
站 D vse 


修改 后 的 文件 如 下 所 示 : 


tinc li 
include <stdio.h> 


h is an im y thi jec 
Ppiements 3” ram 
me: $RC 

t cha RCSinf£ 

int main 
pr "Hello W 
pri “This is t adi 
pri "This file is ur RCS 5 
ex T_SUCCESS} ; 


现在 “ 签 入 ”该 版 本 ， 看 看 RCS 是 如 何 管理 这 些 特 殊 字 符 串 的 : 


3 ci important.c 


enter log message, terminated with single '.' or end of file: 
>> Added $RCSfile$ and $Id$ strings 


如 打 查 看 目录 内 容 ， 你 将 发 现 只 有 RCS 文 件 存 在 : 


如 果 “ 签 出 ”( 使 用 co 命令 ) 该 文件 并 检查 该 源 文件 的 当前 版 本 ， 你 
就 会 发 现 宏 已 被 扩展 。 
$include <stdlib.h> 
This is an important file for managing this project. 


It implements the canonical "Hello World” program. 
Filename: $RCSfile: important.c,v $ 


static char *RCSinfo = “$Id: important.c.v 1.3 2007/07/09 07:07:08 neil Exp $°"; 
main{) 
printf("Hello World\n"); 


printf(*This is an extra line added later\n"); 
printf(*This file is under RCS control. Its ID is\nts\n", RCSinfo); 


实 验 GNU make 和 RCS 

GNU 的 make 命 令 已 内 置 了 一 些 用 于 管理 RCS 文 件 的 规则 。 在 本 例 
中 ， 你 将 看 到 make 命 令 是 如 何 处 理 缺 少 源 文件 的 情况 的 。 
$ rm -f important.c 


$ make important 
~ important.c, v 


实验 解析 

make 命 令 有 这 样 一 条 默认 规则 : 当 make 制 作 的 目标 是 一 个 没有 后 
级 名 的 文件 时 ，make 将 编译 具有 同样 的 名 字 但 加 上 .c 后 级 名 的 源 文件 。 
make 命 令 具 有 的 第 二 条 默认 规则 允许 make 命 令 通过 RCS 系 统 从 文件 
important.c,v 创 建 出 文件 important.c。 在 这 个 例子 中 ， 由 于 文件 
important.c 人 不 存 在，make 命 令 就 用 co 命令 “ 签 出 ”该 文件 的 最 新 版 本 。 编 
译 完成 后 ， 它 还 会 删除 文件 important.c 来 清理 目录 。 


7，ident 命 邻 

你 可 以 用 ident 命 令 查 找 包 含 $Id$ 字 符 串 的 文件 的 版 本 。 因 为 你 将 字 
符 串 保存 到 一 个 变量 中 ， 所 以 它 也 会 出 现在 最 终 的 可 执行 程序 中 。 你 可 
能 会 发 现 ， 如 果 在 源 代 码 中 加 入 一 些 特殊 字符 串 ， 但 未 使 用 它们 ， 一 些 


Fay Ease oe h TREI ARR ARR TS AL, ORT DAZE AS 
中 增加 一 些 对 这 些 字符 串 的 “ 假 ” 访 问 ， 但 随 着 编译 器 越 来 越 好 ， 解 决 这 
个 问题 也 会 变 得 越 来 越 困 难 ! 

下 面 这 个 简单 的 例子 将 显示 ， 你 如 何 使 用 ident 命 令 来 验证 用 于 建立 
一 个 可 执行 文件 的 源 文件 的 RCS 版 本 。 


X 验 ident 命 令 


$S ./important 
> ident important 


实验 解析 

通过 执行 程序 ， 你 看 到 字符 串 确 实 已 合并 到 可 执行 文件 中 。 接 着 ， 
你 用 ident 命 令 从 可 执行 文件 里 提取 出 $Id$ 字 符 串 。 

使 用 RCS 系 统 及 出 现在 可 执行 文件 中 的 $Id$ 字 符 串 的 技巧 可 以 成 为 
一 个 功能 非常 强大 的 工具 ， 它 有 助 于 确定 客户 报告 有 问题 的 文件 的 版 
本 。 你 还 可 以 将 RCS (或 SCCS) 作为 项 目 跟 踪 工 具 的 一 部 分 ， 用 它 来 
跟踪 报告 的 问题 及 其 解决 方法 。 如 果 你 做 的 是 软件 销售 工作 ， 或 者 哪怕 
是 赠送 软件 ， 了 人 解 不 同 版 本 之 间 的 改动 情况 也 是 非常 重要 的 。 

如 果 还 想 了 解 有 关 RCS 的 更 多 信息 ， 除 标准 的 RCS 手 册页 以 外 ， 使 
用 手册 中 的 rcsintro 页 面 给 出 了 完整 的 RCS 系 统 介绍 。ci、co 等 命令 也 有 
其 各 自 的 手册 页 。 


9.3.2 SCCS 


SCCS 提 供 了 与 RCS 非 常 类 似 的 功能 。SCCS 的 优势 在 于 ， 它 得 到 了 
X/Open 规范 的 定义 ， 因 此 所 有 正规 的 UNIX 系 统 都 应 该 支持 它 。 但 较 现 
实 的 情况 是 ，RCS 的 可 移植 性 非常 好 ， 并 且 可 以 自由 发 布 。 所以， 如 果 
你 有 一 个 类 UNIX 系 统 ， 不 管 它 是 否 遵循 X/Open 规 范 ， 你 都 可 以 在 其 上 
获取 并 安装 RCS。 因 此 ， 我 们 不 准备 对 SCCS 做 进一步 的 介绍 ， 而 只 对 
这 两 个 系统 各 目 使 用 的 命令 进行 简单 的 比较 ， 以 方便 那些 准备 在 这 两 个 
系统 之 间 进 行 切换 的 用 户 。 


9.3.3 RCS 和 SCCS 的 比较 


直接 比较 这 两 个 系统 所 提供 的 命令 是 很 困难 的 ， 所 以 表 9-2 只 能 被 
看 作 是 一 个 简单 的 起 点 。 这 里 列 出 的 两 个 系统 的 命令 在 完成 同一 项 任务 
时 并 不 使 用 相同 的 选项 ， 如 果 不 得 不 使 用 SCCS 系 统 ， 你 残 必须 目 己 但 
找 合 适 的 选项 ， een aunt eee eee 
9-2 


RCS SCCS 


除 上 面 列 出 的 那些 命令 外 ，SCCS 系 统 中 的 sccs 命 令 在 功能 上 与 RCS 
系统 中 的 rcs 和 co 命令 有 些 相 交 。 例 如 ， 命 令 sccs edit 和 sccs create 就 分 别 
相当 于 命令 co -1 和 rcs -i。 


9.3.4 CVS 


除 使 用 RCS 系 统 外 ， 管 理 文件 改动 的 另外 一 种 方法 是 使 用 CVS 系 
统 ， 即 并 发 版 本 控制 系统 。CVS 系 统 现在 变 得 非常 流行 ， 可 能 是 因为 与 
RCS 系 统 相 比 ， 它 有 一 个 明显 的 优势 : 人们 可 以 通过 互联 网 使 用 CVS 系 
统 ， 而 不 像 RCS 系 统 只 能 用 在 一 个 共享 的 本 地 目录 中 。CVS 还 文 持 并 行 
开发 ， 即 许多 程序 员 可 以 在 同一 时 间 修 改 同 一 个 文件 ， 而 RCS 在 任 一 时 
间 只 人 允许 一 个 用 户 修 改 一 个 特定 文件 。CVS 的 命令 与 RCS 的 类 似 ， 这 是 
因为 CVS 最 初 是 作为 RCS 的 一 个 前 端 程序 来 开发 的 。 

由 于 CVS 系 统 能 够 以 灵活 的 方式 路 网 络 运行 ， 所 以 它 适 用 于 软件 开 
发 者 之 间 唯 一 的 网 络 连接 方式 就 是 通过 互联 网 这 种 情况 。 许 多 Linux 和 
GNU 项 目 束 是 通过 CVS 系 统 来 帮助 不 同 的 开发 者 协同 工作 的 。 一 般 而 
O tear e CL 
别 。 

在 本 章 中 ， 我 们 将 简要 地 介绍 CVS 的 基础 知识 ， 通 过 学 习 ， 你 可 以 
开始 使 用 本 地 版 本 库 ， 并 知道 如 何 通过 互联 网 ， 从 CVS 服 务 器 上 获取 项 
目的 最 新 源 文件 副本 。 有 关 CVS 的 更 详细 信息 请 参考 由 Per Cederqvist 
撰写 的 CVS 使 用 手册 ， 该 手册 位 于 网 址 http://ximbiot.com/cvs/manual/, 你 
还 可 以 在 该 网 址 上 找到 FAQ 文 件 和 其 他 一 些 有 帮助 的 文件 。 

首先 ， 你 需要 创建 一 个 版 本 库 ，CVS 系 统 将 其 控制 文件 和 它 管理 的 
文件 的 主 副 本 保存 在 这 个 版 本 库 中 。 版 本 库 的 结构 是 树 状 的 ， 所 以 你 不 
仅 可 以 把 一 个 项 目的 完整 目录 结构 保存 在 一 个 版 本 库 中 ， 还 可 以 在 同一 
个 版 本 库 中 保存 多 个 项 目 。 当 然 ， 你 也 可 以 将 彼此 没有 关联 的 项 目 分 别 
保存 到 不 同 的 版 本 库 中 。 你 将 在 后 面 看 到 如 何 告诉 CVS 系 统 你 要 使 用 哪 


一 个 版 本 库 。 

1. CVS 的 本 地 使 用 

我 们 首先 创建 一 个 版 本 库 。 为 保持 简单 ， 这 将 是 一 个 本 地 版 本 库 ， 
并 且 因 为 你 将 只 使 用 这 一 个 版 本 库 ， 所 以 适宜 将 其 放 到 /usrvlocal 目 录 
下 。 在 大 多 数 的 Linux 发 行 版 中 ， 所 有 的 普通 用 户 都 属于 组 users, 所 以 将 
该 版 本 库 的 属 组 也 设 为 users, 这 样 所 有 用 户 都 可 以 访问 它 了 。 

以 超级 用 户 的 喘 份 为 版 本 库 创建 目录 : 


è chgrp users /usr/local/repository 
è chmod g+w /usr/local/repository 


切换 为 普通 用 户 ， 将 该 目录 初始 化 为 一 个 CVS 版 本 库 。 如 果 你 不 属 
于 users 组 ， 那 么 需要 拥有 目录 /usr/local/repository 的 写 权 限 ， 才 能 执行 这 
— BE. 


S cvs -d /usr/local/repository init 


-d 选 项 告诉 CVS 你 希望 版 本 库 创 建 在 哪个 目录 中 。 

现在 版 本 库 已 创建 好 ， 你 可 以 将 项 目的 初始 版 本 保存 到 CVS 中 了 。 
做 这 项 工作 时 ， 你 可 以 利用 一 个 小 技巧 来 节省 一 些 打 字 的 时 间 。 所 有 的 
cvs 命 令 在 查找 CVS 目 录 时 都 可 以 使 用 两 种 方法 : 一 是 在 命令 行 中 使 用 - 
d<path> 选 项 〈 就 像 你 刚才 使 用 init 命 令 时 那样 ) ;如果 未 使 用 -d 选 项 ， 
cvs 命 令 就 会 去 查看 环境 变量 CVSROOT 的 值 。 你 不 想 在 每 次 执行 cvs 命 
令 时 都 加 上 -d 选 项 ， 所 以 你 将 用 第 二 种 方法 设置 环境 变量 CVSROOT。 
如 果 使 用 的 shell 是 bash, 则 设置 环境 变量 的 方法 如 下 所 示 : 


S export CVSROOT=/usr/local/repository 


首先 ， 切 换 到 项 目 所 在 的 目录 ， 然 后 告诉 CVS 导 入 该 目录 下 的 所 有 
文件 。 对 CVS 系 统 而 言 ， 一 个 项 目 就 是 相关 文件 和 目录 的 集合 。 一 般 来 
说 ， 它 包 插 用 于 创建 应 用 程序 所 需 的 所 有 文件 。 术 语 导 入 的 含义 是 ， 将 
文件 置 于 CVS 的 控制 之 下 ， 并 将 它们 复制 到 CVS 版 本 库 中 。 对 本 例 来 
说 ， 你 有 一 个 名 为 cvs-sp〈 即 CVS simple project 的 缩写 ) 的 目录 ， 它 包 
含 两 个 文件 : hello.c 和 Makefile: 


$S cd cvs-sp 
5 ls -1 


users 


-rw-r--r-- l nei s 109 2003-02-15 11:04 hell > 
CVS 导 入 命令 是 cvs import, 它 的 使 用 方法 如 下 所 示 : 
S evs import -m"Initial version of Simple Project" wrox/chap9-cvs wrox start 


上 面 这 条 命令 告诉 CVS 导 入 当前 目录 Cevs-sp) 下 的 所 有 文件 ， 同 


时 为 其 加 上 一 条 日 志 信 息 
参数 wrox/chap9-cvs 告 告诉 CVS 保 存 新 项 目的 位 置 ， 这 里 给 出 的 是 相 
对 于 CVS 树 根 的 路 径 。 请 记 住 ， 只 要 你 愿意 ，CVS 可 以 在 同一 个 版 本 库 
中 保存 多 个 项 目 。 选 项 wrox 相 当 于 厂商 标签 ， 它 用 于 标识 导入 文件 的 初 
始 版 本 的 提供 者 。 选 项 start 是 一 个 版 本 标签 ， 它 用 于 标识 一 组 相关 的 文 
ns CVS 对 上 面 命 令 的 啊 应 如 
ZN: 


p9-cvs/hello.c 
N wrox/chap9-cvs/Makefile 


输出 # 果 表明 它 成 功 地 导入 了 两 个 文件 。 
现在 是 查看 能 否 从 CVS 系 统 中 获取 文件 的 好 时 机 。 你 可 以 先 建立 一 
个 junk 目 录 ， 然 后 导出 文件 以 确认 一 切 工作 正常 。 


$ evs checkout wrox/chap$-cvs 
U wrox/chap9-cvs/Makefile 
U wrox/chap9-cvs/hello.c 


你 同 CVS 给 出 与 导入 文件 时 相同 的 路 径 。CVS 在 当前 目录 中 创建 
wrox/chap9-cvs 子 目录 ， 然 后 将 文件 放 到 该 子 目 录 中 。 

现在 开始 对 项 目 做 一 些 改动 。 编 辑 目 录 wrox/chap9-cvs 中 的 文件 
hello.c, tis cima 的 修改 ， 在 该 文件 中 添加 下 面 一 行内 容 : 

然后 重新 编译 并 运行 程序 以 保证 一 切 顺 利 。 


5 make 


iell - hell 
5 ./hello 
iello World 


你 可 以 询问 CVS 这 个 项 目 有 哪些 改动 。 你 并 不 需要 告诉 CVS 你 关心 
的 文件 具体 是 哪个 ， 它 能 够 一 次 性 完成 对 整个 目录 的 检查 : 
$ cvs diff 

CVS 啊 应 如 下 : 


你 对 自己 做 的 改动 很 满意 ， 所 以 决定 将 其 提交 给 CVS。 

当 把 改动 提交 给 CVS 时 ， 它 会 启动 一 个 编辑 器 让 你 输入 一 条 日 志 信 
息 。 你 可 以 在 运行 commit 命 令 之 前 ， 通 过 设置 环境 变量 CVSEDITOR 来 
强制 使 用 一 个 特定 的 编辑 器 。 
$ cvs commit 


CVS 的 响应 表明 它 正 在 导入 的 内 容 : 


现在 可 以 询问 CVS, 这 个 项 目 自 第 一 次 导入 后 的 改动 情况 。 你 询问 的 
是 项 目 wrox/chap9-cvs 自 版 本 1.1( 即 初始 化 版 本 〉 以 来 的 所 有 改动 情 
况 。 


$ evs rdiff -r1.1 wrox/chap9-cvs 
CVS 给 出 的 结果 如 下 : 


EE 
D wes 


exit XT 


假设 在 CVS 系 统 之 外 的 本 地 目录 中 还 有 一 份 代码 的 副本 ， 现 在 你 想 
刷新 该 目录 中 的 文件 以 更 新 那些 你 没有 修改 过 、 但 已 被 其 他 人 改动 过 的 
文件 。CVS 的 update 命 令 可 以 帮助 你 完成 这 一 工作 。 首 先 移动 到 项 目 路 


径 的 顶层 ， 在 本 例 中 就 是 包含 wrox 了 目录 的 目录 ， 然 后 执行 下 面 的 合 
LR 


S cvs update -Pd wrox/chap9-cvs 


CVS 开 始 刷 新 相关 文件 ， 它 把 其 他 人 修改 过 而 你 未 动 过 的 文件 从 版 
本 库 中 提取 出 来 ， 并 放 到 你 的 本 地 目录 中 。 当 然 ， 其 中 一 些 修改 可 能 与 
你 做 的 修改 有 冲突 ， 但 这 是 需要 你 解决 的 问题 ,CVS 是 好 东西 ， 但 它 并 
不 是 无 所 不 能 ! 


至 此 ， 你 应 该 可 以 看 出 ，CVS 的 用 法 与 RCS 相 当 接 近 。 但 它们 之 间 
其 实 有 一 个 我 们 还 未 提 及 的 十 分 重要 的 区 别 ， 那 就 是 CVS 有 具备 在 不 事先 
挂 载 文件 系统 的 情况 下 路 网 络 操作 的 能 力 。 

2. 跨 网 络 访问 CVS 

前 面 已 经 介绍 过 ， 你 可 以 通过 为 每 个 命令 加 上 -d 选 项 或 设置 环境 变 
量 CVSROOT 来 告诉 CVS 版 本 库 所 在 的 位 置 。 如 果 想 路 网 络 操作 ， 你 只 
需要 使 用 这 个 参数 的 一 个 更 高 级 的 语法 即 可 。 例 如 ， 在 写作 本 书 的 时 
Ik, GNOME (GNU 网 络 对 象 模型 环境 ， 一 个 流行 的 开源 图 形 桌 面 系 
统 ) 的 开发 源 代码 都 是 通过 CVS 系 统 在 因特网 上 访问 的 。 你 只 需 在 路 径 
说 明 符 的 前 面 添 加 上 一 些 网 络 信息 即 可 指定 正确 的 CVS 版 本 库 的 位 置 。 

作为 另外 一 个 例子 ， 你 可 以 通过 设置 环境 变量 CVSROOT 为 : 
pserver: anonymous@dev.w3.org: /sources/public, 将 CVS 指 向 Web 标 准 组 
织 W3C 的 CVS 版 本 库 。 这 个 设置 告诉 CVS, 该 版 本 库 使 用 密码 验证 
(pserver) , 且 位 于 服务 器 dev.w3.org 上 。 

在 访问 源 代码 之 前 ， 你 需要 先 登 录 ， 如 下 所 示 : 


export CVSROOT#=:pserver : anonymous@dev.w3.org:/sources/public 
5 cvs login 


在 提示 输入 密码 时 输入 anonymous。 

现在 可 以 使 用 cvs 命 令 了 ， 命 令 的 用 法 和 你 对 本 地 版 本 库 进 行 操作 
时 一 样 ， 只 有 一 个 小 区 别 : 需要 给 每 个 cvs 命 令 加 上 -z3 选 项 以 强制 执行 
数据 压缩 ， 这 可 以 节约 网 络 市 宽 。 

假设 想 要 获取 W3C HTML 验 证 程序 的 源 代 码 ， 使 用 的 命令 是 : 


S evs -z3 checkout validator 


如 果 想 把 上 自己 的 版 本 库 设 置 为 可 以 通过 网 络 访问 ， 你 就 需要 在 上 自己 
的 机 器 上 启动 CVS 服 务 。 这 个 任务 可 以 通过 xinetd 或 inetd 来 完成 ， 具 体 
使 用 哪个 进程 取决 于 你 的 Linux 系 统 配置 。 对 xinetd 来 说 ， 你 需要 编辑 文 
件 /etc/xinetd.d/cvs 来 反映 CVS 版 本 库 的 位 置 ， 并 使 用 系统 配置 工具 来 激 
活 和 局 动 cvs 服 务 。 对 inetd 来 说 ， 你 只 需 在 文件 /etwinetd.conf 中 添加 如 下 
一 行 语句 ， 然 后 重启 inetd 即 可 。 


这 条 语句 告诉 inetd 进 程 为 连接 到 本 机 2401 端 口 的 客户 自动 启动 一 个 
CVS 会 话 ， 端 口 2401 是 标准 的 CVS 服 务 器 监听 端口 。 有 关 如 何 通过 inetd 
启动 网 络 服务 的 更 详细 资料 请 参考 inetd 和 inetd.conf 的 手册 页 。 

如 果 想 通过 网 络 访 问 的 方式 使 用 CVS 版 本 库 ， 你 必须 正确 地 设置 环 
境 变 量 CVSROOT。 例 如 : 


$ export CVSROOT=:pserver:neil@localhost: /usr/local/repository 


目前 为 止 ， 我 们 仅 简 单 介绍 了 CvVS 的 功能 。 如 果 想 用 好 CVS 系 统 ， 
我 们 强烈 建议 你 设置 一 个 本 地 版 本 库 来 进行 练习 ， 并 获取 更 全 面 的 CVS 
文档 。 请 记 住 ，CVS 的 源 代码 是 开放 的 ， 如 果 搞 不 懂 代 码 的 作用 和 日 
的 ， 或 者 (虽然 不 太 可 能 ， 但 确实 有 可 能 ! ) 认为 自己 发 现 了 一 个 
bug， 你 总 是 可 以 获取 源 代码 并 自己 进行 分 析 。CVS 的 主页 是 


http://ximbiot.com/cvs/cvshome/。 


9.3.5 ”CVS 的 前 端 程 


许多 图 形 前 端 程序 可 用 于 访问 CVS 版 本 库 。 网 址 
http://www.wincvs.org 提 供 了 可 能 是 最 好 的 多 操作 系统 前 端 程 序 集合 。 
该 网 址 上 有 用 于 Windows、Macintosh、Linux 系 统 的 客户 端 程序 。 

CVS 前 端 程序 通常 都 允许 创建 和 管理 版 本 库 ， 包 括 远 程 访问 基于 网 
络 的 版 本 库 。 

图 9-1 显 示 了 我 们 的 简单 应 用 程序 的 开发 历史 ， 这 是 在 一 个 Windows 
网 络 客 户 端 上 使 用 WinCVS 前 端 程序 显示 的 。 


Ss? mm ioc JO CH HHH xX See ag t anes! a +24 
nm t = /* SERRRREL ax 2D 
T ry a | | E | [rnat 
Oooo alk aT: 卫 y yi 
zj wee P boe ‘ant WENDO OF 44 
sn ~ eee ev m1 
i E 
*helle.e’ 


图 9-1 


9.3.6 Subversion 


Subversion 旨 在 成 为 开源 社区 中 用 于 强制 蔡 换 CVS 的 版 本 控制 系 
统 。 根 据 Subversion 主 页 http://subversion.tigris.org 上 的 说 法 ， 它 被 设计 为 
一 个 “更 好 的 CVS”。 因 此 ， 它 具有 CVS 的 大 多 数 功能 ， 并 且 其 接口 的 工 
作 方 起 也 与 CVS 类 似 。 

Subversion 正 变 得 日 益 普 有 及， 尤其 对 于 社区 开发 的 项 目 更 是 如 此 。 
因为 在 这 些 项 目 中 ， 开 发 人 员 都 是 通过 因特网 来 共同 开发 一 个 应 用 程 
序 。 大 多 数 Subversion 用 户 都 是 连接 到 一 个 由 开发 项 目的 管理 员 建 立 的 
基于 网 络 的 版 本 库 。 个 人 或 小 团队 的 项 目 使 用 Subversion 的 并 不 多 ， 
CVS 仍 然 是 他 们 的 首选 工具 。 

表 9-3 比 较 了 CVS 和 Subversion 中 一 些 完成 同样 功能 的 命令 。 

表 9-3 


_CVS ‘Subversion 


有 关 Subversion 的 完整 文档 见 网 址 http://svnbook.red-bean， com 上 的 
在 线 书籍 Version Control with Subversion〔 使 用 Subversion 进 行 版 本 控 
制 ) 。 


9.4 编写 手册 页 


如 果 正 在 编写 一 个 新 命令 作为 整个 开发 任务 的 一 部 分 ， 你 应 该 为 其 
创建 手册 页 。 你 可 能 已 注意 到 ， 大 多 数 手册 页 的 排版 格式 都 很 相似 ， 它 
们 基本 上 都 由 以 下 几 部 分 组 成 : 

Header (标题 ) 

Name (ZFR) 
Synopsis (语法 格式 ) 
Description (说 明 ) 
Options (选项 ) 

Files (相关 文件 ) 

See also〈 其 他 参考 ) 
口 _Bugs〈 已 知 漏洞 ) 

你 可 以 在 手册 页 中 省 去 无 关 部 分 。Linux 的 手册 页 还 经 常会 在 结尾 
出 现 一 个 Author (FRE) 部 分 。 

UNIX 的 手册 页 是 通过 工具 nroff 排 版 的 ， 在 大 多 数 Linux 系 统 中 ， 用 
于 完成 相同 功能 的 工具 为 groff， 它 是 由 GNU 项 目 开 发 的 。 这 两 个 工具 都 
是 在 早期 的 排版 工具 roff 或 ran-off 的 基础 上 开发 的 。 nroff 或 groff 命 令 的 
输入 都 是 纯 文本 ， 只 是 和 企 看 起 来 ， 它 们 的 语法 都 显得 非常 星 深 难 懂 。 但 
无 需 紧 张 ， 在 UNIX 编 程 中 ， 编 写 新 程序 的 一 种 最 简单 的 方法 就 是 以 现 
有 的 程序 作为 起 点 ， 并 对 其 进行 修改 ， 编 写 手册 页 也 是 一 样 。 

对 groff〈 或 nroff) 命令 所 使 用 的 各 种 选项 、 命 令 和 宏 进 行 详细 说 明 
超出 了 本 书 讨论 的 范围 。 我 们 在 这 里 只 提供 一 个 简单 的 模板 ， 读 者 可 以 
借鉴 并 写 出 自己 的 手册 页 。 

下 面 是 一 个 用 于 myapp 应 用 程序 的 简单 的 手册 页 的 源 代码 ， 它 位 于 
文件 myapp.1 中 : 


OOOO0U0RO 


SH OPTION 

.PP 

It doesn't have any, but let's pretend, to make this template complete: 
"TP 


BI \-option 

If there was an option, it would not be -option. 

.SH RESOURCES 

PP 
myapp uses almost no resources. 

.SH DIAGNOSTICS 
The program shouldn't output anything, so if you find it doing so there's 
probably something wrong. The return value is zero. 

.SH SEE ALSO 
The only other program we know with this little functionality is the 
ubiquitous hello world application. 

.SH COPYRIGHT 
myapp is Copyright (c) 2007 Wiley Publishing, Inc. 
This program is free software; you can redistribute it and/or modify 
it under the terms of the GNU General Public License as published by 
the Pree Software Foundation; either version 2 of the License, or 
(at your option} any later version. 

This program is distributed in the hope that it will be useful, 

but WITHOUT ANY WARRANTY; without even the implied warranty of 
MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the 

GNU General Public License for more details. 

You should have received a copy of the GNU General Public License 
along with this program; if not, write to the Free Software 
Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 021111307 USA. 
.SH BUGS 

There probably are some, but we don't know what they are yet. 

.SH AUTHORS 

Neil Matthew and Rick Stones 


“正如 你 所 看 到 的 ， 宏 通过 在 一 行 开头 的 小 数 点 〈.) 引入 ， 并 且 一 
般 采 用 缩写 形式 。 第 一 行 结尾 的 数字 1 表示 这 个 命令 出 现在 手册 页 的 哪 
个 部 分 。 因 为 命令 出 现在 手册 页 的 第 一 部 分 ， 所 以 这 里 就 是 我 们 放置 新 
应 用 程序 说 明 的 位 置 。 

你 可 以 通过 修改 这 个 样本 或 参考 其 他 命令 的 手册 页 源 代 码 来 生成 目 
己 的 手册 页 。 你 可 能 还 需要 看 一 下 Linux 的 手册 页 mini-HowTo， 它 由 
Jens Schweikhardt 编 写 ， 并 作为 Linux 文 档 项 目的 一 部 分 收录 在 
http://www.tldp.org/ 中 。 

现在 已 经 有 了 手册 页 的 源 代码 ， 你 可 以 用 groff 命 令 来 处 理 它 。groff 
命令 通常 产生 ASCII 文 本 〈-Tascii) 或 PostScript (-Tps) 。 你 可 以 用 选 
OE sie ene 这 会 让 groff 加 载 专 用 的 手册 页 宏 定 


S$ groff -Tascii -man myapp.1 
它 给 出 如 下 的 输出 结 


MYAPP (1 

NAME 
Myapr A simple demonstration application that does very 
little 


SYNOPSIS 


ayapp 


DESCRIPTION 


TADp 
OPTIONS 


-option 
RESOURCES 


DIAGNOSTICS 


SEE ALSO 


COPYRIGHT 


AUTHORS 


现在 你 已 测试 了 手册 页 ， 下 一 步 就 需要 安装 它 。 显 示 手 册页 的 man 
命令 通过 环境 变量 MANPATH 来 搜索 手册 页 。 你 可 以 将 新 的 手册 页 放置 
到 一 个 本 地 手册 页 目录 中 ， 或 者 将 其 直接 放 到 系统 目录 /usr/man/man1 
中 


当 用 户 第 一 次 要 求 阅 读 这 个 手册 页 时 ，man 命 令 将 自动 对 其 进行 排 
版 并 显示 排版 结果 。 有 些 版 本 的 man 命 令 还 可 以 自动 生成 并 保存 一 份 预 
排版 (还 有 可 能 经 过 压缩 的 ASCII 文 本 版 本 的 手册 页 ， 来 加 速 对 同一 
页 面 的 后 续 访 问 请 求 的 处 理 。 


9.5 RITEK 


发 行 软件 面临 的 最 主要 问题 是 ， 如 何 确保 已 包含 所 有 必要 的 文件 并 
且 和 它们 都 属于 正确 的 版 本 。 笠 运 的 是 ， 因 特 网 编程 社区 已 形 成 了 一 套 健 
壮 的 方法 ， 非 常 有 助 于 解决 这 些 问题 ， 这 些 方法 包括 以 下 几 个 。 

O 利用 所 有 UNIX 系 统 都 有 的 标准 工具 将 软件 所 需 的 所 有 文件 打包 

为 一 个 单独 的 软件 包 文 件 。 

O 控制 软件 包 的 版 本 编号。 

O “建立 文件 命名 规范 ， 在 软件 包 文 件 的 名 字 中 包含 版 本 号 ， 从 而 

方便 用 户 辨 认 他 们 所 使 用 的 软件 的 版 本 。 

O 在 软件 包 中 使 用 子 目录 ， 以 确保 从 软件 包 中 提取 的 文件 都 被 放 

pe eee ee 


这 些 方法 的 产生 意味 着 软件 的 发 行 工作 能 够 轻松 、 可 靠 地 完成 。 但 
软件 的 安装 是 否 容 易 则 是 男 外 一 回 事 ， 因 为 这 与 软件 本 里 以 及 准备 安装 
eat 但 至 少 你 可 以 确保 软件 包 中 的 所 有 文件 都 是 正确 


9.5.1 _patch 程 


软件 发 行 以 后 ， 用 户 发 现 软件 的 漏洞 或 开发 者 希望 增强 或 升级 软件 
的 情况 几乎 是 不 可 避免 的 。 如 果 开 发 者 以 二 进 制 文件 的 形式 发 行 软件 ， 
他 们 通常 只 会 发 行 新 的 二 进 制 文件 。 有 时 (AREXE), J] BRER 
Wo 

另 一 方面 ， 以 源 代 码 的 形式 来 发 行 软件 是 个 好 主意 ， 因 为 它 允 许 用 
户 了 解 你 是 如 何 实现 该 软件 以 及 如 何 运 用 一 些 功 能 的 。 它 还 可 以 让 用 户 
检查 程序 在 做 什么 ， 并 且 人 允许 用 户 重 用 软件 的 部 分 源 代码 (前 提 是 他 们 
遵守 相关 的 许可 证 协议 〉。 

但 是 ， 对 于 Linux 内 核 的 源 代 码 来 襄 ， 它 在 压缩 之 后 仍然 有 数 十 光 
之 多 ， 包 装 并 传送 一 套 新 版 本 的 内 核 源 代码 将 消耗 大 量 的 资源 ， 而 事实 
上 ， 各 版 本 之 间 可 能 只 有 很 少 一 部 分 的 源 代码 发 生 了 改动 。 

幸运 的 是 ， 我 们 有 一 个 解决 这 一 问题 的 工具 程序 一 patch， 它 由 
Larry Wall 编写 ， 他 也 是 Pen 编程 语言 的 开发 者 。patch 命 令 人 允许 软件 的 开 
发 者 只 发 行 定义 两 个 版 本 之 间 区 别 的 文件 ， 这 样 无 论 是 谁 ， 只 要 他 拥有 
某 个 文件 的 第 一 个 版 本 和 第 一 个 版 本 与 第 二 个 版 本 之 间 的 区 别 文 件 ， 他 


就 可 以 用 patch 命 令 来 和 目 己 生成 该 文件 的 第 二 个 版 本 。 
BaT 一 个 版 本 : 


ile one 
line 2 
line 3 
rh pd 


chere is r 
line 6 


es le les 


你 可 以 使 用 di 命令 列 出 两 个 版 本 之 间 的 不 同 之 处 ， 


S diff filel.e file2.c > diffs 
diffs 文 件 的 内 容 如 下 所 示 : 


< This is e one 
> This is e two 
4c4,5 


> a new line 8 


这 实际 上 是 一 组 编辑 器 命令 ， 它 们 用 于 将 一 个 文件 修改 为 男 一 个 文 
件 。 假 设 你 已 经 有 了 文件 flel.c 和 diffs， 就 可 以 用 patch 命 令 来 更 新 文件 
filel.c， 如 下 所 示 : 


$ patch filet. c diffs 


Hmm. . like a normal diff tọ me... 
atchin “fil e filel.c usin an A 
nk #1 succeeded 
nk # i eded a 
k # eeded 


patch 命 令 将 文件 filel.c 修 改 为 与 file2.c 一 模 一 样 。 

patch 命 令 还 有 男 一 个 技巧 : Eh J KIA E 力 。 假释 你 :不 喜欢 刚才 的 
修改 ， 想 将 filel.c 恢 复 为 原来 的 样子 。 没 问题 ， 你 只 需 再 次 使 用 patch 命 
令 ， 不 过 这 一 次 要 使 用 -R ( 反 向 补丁 ) 选 项: 


$ patch -R filel.c diffs 
Fir Looks like a normal diff 


Patching file filel.c using Plan A.. 


文件 flel.c 将 回 到 它 最 初 的 样子 。 

patch 命 令 还 有 其 他 几 个 选项 ， 但 一 般 情况 下 它 会 根据 输入 的 内 容 来 
判断 用 户 想 做 什么 ， 然 后 执行 正确 的 操作 。 如 果 patch 命 令 执 行 失 败 ， 它 
会 创建 一 个 后 级 名 为 . rej 的 文件 ， 在 该 文件 中 将 包含 无 法 打上 补丁 的 文 

在 处 理 软 件 的 补丁 时 ， 使 用 diff 命 令 的 -c 选 项 是 个 好 办 法 。 这 个 选 
项 的 作用 是 产生 一 个 基于 上 下 文 的 diff， 即 提供 每 处 修改 的 前 后 几 行 内 
容 ， 这 样 patch 命 令 可 以 在 打 补 丁 之 前 验证 上 下 文 是 否 匹 配 ， 而 补丁 文件 
本 身 也 更 容易 阅读 。 


如 果 你 在 东 个 程序 中 发 现 了 漏洞 并 进行 了 修补 ， 给 程序 的 开发 
0 更 准确 ， 也 更 
礼貌 。 


9.5.2 其 他 软件 发 行 工具 


Linux 的 程序 和 源 代 码 通 党 以 打包 压缩 文件 的 格式 发 行 ， 在 文件 名 
中 包含 软件 的 版 本 号 ， 文 件 的 后 级 名 为 .tar.gz 或 .tgz， 这 类 文件 通常 也 被 
称 为 tarballs 文 件 。 如 果 使 用 的 是 普通 的 tar 命 令 ， 则 创建 tarballs 文 件 必须 
经 过 两 个 步骤 。 eai a aE 


$ tar cvf myapp-1.0.tar main.c 2.c 3.c *.h myapp.1 Makefile5 
main, 


你 — 有 了 一 个 TAR 文件 ， 如 下 所 示 : 


$ ls -1 *.ta 


你 可 以 用 压缩 程序 gzip 对 该 文件 进行 压缩 ， 使 得 其 容量 更 小 : 


$ gzip myapp-1.0.tar 
$ ls -l1 *.gz 
nt dt ht Tadas } 


正如 你 所 看 到 的 ， 最 终 的 文件 容量 被 压缩 的 非常 小 。 你 还 可 以 把 文 
件 的 后 级 名 .tar.gz 改 为 更 简单 的 .tgz， 如 下 所 示 : 


$ mv myapp-1.0.tar.gz myapp_vl.tgz 


这 种 以 一 个 小 数 点 和 3 个 字符 结尾 的 文件 命名 方式 看 上 去 像 是 针对 
Windows 系 统 的 一 种 妥协 ， 因 为 Windows 系 统 不 同 于 Linux 和 UNIX 系 
统 ， 它 对 文件 后 缀 名 正确 与 否 的 依赖 性 非常 强 。 要 想 再 取 回 文件 ， 你 需 
要 先 解压 缩 tar 文 件 ， 再 解 包 ， 从 而 将 文件 释放 出 来 ， 如 下 所 示 : 


$ mv myapp_vl.tgz myapp-1.0.tar.gz 
$ gzip -d myapp-1.0.tar.gz 

$ tar xvf myapp-1.0.tar 

main.c 


“如 果 使 用 的 是 GNU 版 本 的 tar 命 令 ， 情 况 将 变 得 更 简单 ， 你 仅 用 一 
步 就 可 以 创建 打包 压缩 文件 ， 如 下 所 示 : 


$ tar zcvf myapp_vl.tgz main.c 2.c 3.c *.h myapp.1 Makefile5 


同样 ， 解 压缩 操作 也 很 简单 ， 如 下 所 示 : 


$ tar zxvf myapp_vi.tgz 


如 果 想 在 没有 真正 解压 缩 文件 的 情况 下 了 解 打包 压缩 文件 的 内 容 ， 
你 可 以 使 用 tar 命 令 的 另 一 个 选项 ztvf。 
我 们 在 上 面 的 例子 中 使 用 了 tar 命 令 ， 但 对 其 选项 的 摘 述 仅 限 于 例子 


中 使 用 的 那些 选项 。 下 面 我 们 将 对 该 命令 及 其 常用 选项 做 简单 的 说 明 。 
正如 你 在 上 面 的 例子 中 所 见 ，tar 命 令 的 基本 语法 是 : 


tar [options] [list of files] 


列表 中 的 第 一 项 是 目标 ， 虽 然 我 们 一 直 处 理 的 都 是 文件 ， 但 它 也 可 
以 是 一 个 设备 。 列 表 中 的 其 他 项 将 根据 选项 的 情况 被 添加 到 新 档案 文件 
或 已 有 档案 文件 中 。 列 表 中 还 可 以 包含 目录 ， 默 认 情 况 下 ， 该 目录 中 的 
所 有 子 目 录 都 将 被 包含 到 档案 文件 中 。 释 放 文 件 并 不 需要 给 出 文件 的 名 
字 ， 因 为 tar 命 令 将 保留 文件 的 完整 路 径 。 

在 本 节 中 ， 我 们 使 用 了 tar 命 令 的 如 下 6 个 选项 的 组 合 。 
c: 创建 新 档案 文件 。 
f: 指定 目标 为 一 个 文件 而 不 是 一 个 设备 。 
t: 列 出 档案 文件 的 内 容 ， 但 并 不 真正 释放 它们 。 
v (verbose): 显示 tar 命 令 执行 的 详细 过 程 。 
x: 从 档案 文件 中 释放 文件 。 
z: 在 GNU 版 本 的 tar 命 令 中 用 gzip 命 令 压缩 档案 文件 。 

tar 命 令 还 有 许多 其 他 选项 ， 我 们 可 以 用 这 些 选 项 来 更 好 地 控制 tar 命 
人 详细 资料 请 参考 tar 命 令 的 手册 


口 口 口 口 口 口 


= 


9.6 ”RPM 软件 所 


RPM 软件 包 管 理 程序 (RPM Package Manager) 或 简称 为 RPM (我 
想 你 肯定 喜欢 这 样 一 种 递归 简写 的 方式 ) 一 开始 只 是 Red Hat Linux 的 软 
件 包 格式 ， 它 最 初 的 名 字 为 Red Hat 软 件 包 管理 程序 (Red Hat Package 
Manager) . 从 那 以 后 ，RPM 逐 渐 成 为 许多 其 他 Linux 发 行 版 (包括 
SUSE Linux) 所 接受 的 一 种 软件 包 格式 ，Linux 标 准 化 规范 (Linux 
Standards Base， 人 简称 为 LSB) 将 RPM 作为 其 官方 软件 包 格 式 ，LSB 的 网 
址 为 www.linuxbase.org。 

下 面 是 RPM 的 主要 优点 。 

O “使 用 广泛 。 许 多 Linux 发 行 版 至 少 都 可 以 安装 RPM 软件 包 ， 或 者 

a a RPM 还 被 移植 到 许多 其 他 的 操 

O 它 能 够 只 用 一 条 命令 来 安装 软件 包 。 你 还 可 以 自动 安装 软件 

包 ， 因 为 RPM 了 就 是 专 为 方便 无 人 管理 设计 的 。 同 样 ， 删 除 或 升级 软 

件 包 也 只 需 使 用 一 条 命令 。 

Oo “只 需要 处 理 一 个 文件 。 一 个 RPM 软件 包 就 保存 在 一 个 单独 的 文 

件 中 ， 这 使 得 在 不 同系 统 之 间 传 输 软件 包 变 得 非常 容易 。 

O RPM 上 自动 处 理 软件 包 之 间 的 依赖 关系 检查 。RPM 系 统 包 含 一 个 

数据 库 ， 该 数据 库 中 记录 了 已 安装 的 所 有 软件 包 的 信息 ， 包 括 每 个 

软件 包 所 提供 的 内 容 以 及 安装 每 个 软件 包 的 要 求 。 

O RPM 软 件 包 被 设计 为 由 “最 干净 ”的 源 代码 而 来 ， 从 而 可 以 对 它 

重新 编译 。RPM 文 持 如 patch 这 样 的 Linux 工 具 ， 可 以 在 编译 过 程 中 

为 软件 的 源 代 人 码 打上 补丁 。 


9.6.1 RPM 软 


每 个 RPM 软 件 包 都 存储 在 一 个 以 。rpm 为 后 级 名 的 文件 中 。 软 件 包 
文件 通常 齐 循 着 一 种 命名 规范 ， 它 的 结构 如 下 所 示 : 


name-version-release.architecture.rpm 


在 这 个 结构 中 ，name 指 定 该 软件 包 的 通用 名 称 ， 例 如 对 于 MySQL 
数据 库 来 说 ， 它 就 是 mysql， 对 于 make 编 译 工具 来 说 ， 它 就 是 make。 
version 指 定 该 软件 的 版 本 号 ， 例 如 MySQL 的 版 本 5.0.41。 release 包 含 一 
个 数字 ， 它 指定 软件 包 的 RPM 版 本 号 。 这 个 版 本 号 非常 重要 ， 因 为 
RPM 软 件 包 是 通过 一 组 指令 建立 的 (我 们 将 在 9.6.3 节 中 介绍 这 方面 的 内 


A) ， 你 可 以 通过 release 来 跟踪 编译 指令 的 改动 情况 。 
architecture 指 定 程序 的 架构 ， 例 如 对 于 基于 Intel 的 系统 ， 它 为 
i386。 对 于 已 编译 好 的 程序 来 说 ， 它 非常 重要 ， 例 如 ， 针 对 SPARC 处 理 
器 创建 的 可 执行 程序 是 不 能 在 Intel 处 理 器 上 运行 的 。 architecture 的 值 可 
以 是 通用 的 ， 例 如 针对 SPARC 处 理 器 的 Sparc， 也 可 以 是 特定 的 ， 例 如 
针对 v9 SPARC 处 理 器 的 sparcv9， 或 针对 AMD Athlon 心 请 的 athlon。 除 

非 你 强制 忽略 它 ， 否 则 RPM 系统 将 阻止 安装 来 自 不 同 架构 的 软件 包 。 

如 果 architecture 设 为 一 个 特殊 的 值 noarch， 就 表示 该 软件 包 并 不 针 
对 某 个 特定 的 架构 ， 例 如 文档 、Java 程 序 或 Perl 模 块 。 如 果 architecture 设 
为 src， 就 表示 该 软件 包 为 RPM 源 代码 软件 包 ， 在 该 软件 包 中 包含 的 是 
源 文件 和 用 于 将 它 编译 为 二 进 制 RPM 软 件 包 的 指令 。 大 多 数 你 可 以 在 网 
络 上 找到 的 RPM 软件 包 都 是 针对 某 个 特定 架构 预 编译 的 软件 包 ， 这 主要 
是 为 了 方便 用 户 的 安装 。 你 可 以 在 网 络 上 找到 数 千 种 预 编 译 好 的 RPM 软 
eA, VERVE URS PE BOE A RL o 

此 外 ， 一 些 软件 包 的 使 用 非常 依赖 于 某 个 特定 的 Linux 版 本 ， 人 针对 
这 种 情况 ， 直 接 下 载 一 个 预 编译 好 的 软件 包 要 比 手工 测试 所 有 的 软件 包 
组 件 要 容易 得 多 。 例 如 ， 曾 经 有 一 个 802. 11b 无 线 网 络 软件 包 ， 它 是 针 
对 某 个 特定 的 Linux 发 行 版 的 某 个 特定 内 核 补丁 级 别 预 编译 的 软件 包 ， 
比如 说 它 的 文件 名 为 kernel-wlan-ng-modules-rh9. 18-0.2.0-7-athlon.rpm, 
它 包 含 的 是 一 个 内 核 模块 ， 针 对 的 用 户主 机 为 AMD Athlon 处 理 右 的 系 
统 、Linux 发 行 版 为 RedHat 9.0、 内 核 版 本 为 2.4.20-18。 


9.6.2 ZÆ RPM 


你 用 rpm 命 令 来 安装 RPM 软件 包 ， 该 命令 的 语法 格式 很 简单 ， 如 下 
所 示 : 


rpm -Uhv name-version-release.architecture.rpm 


例如 : 
$ rpm -Uhv MySQL-server-5.0.41-0.glibc23.i386.rpm 

这 个 命令 将 安装 (或 是 升级 ) MySQL 数 据 库 服务 器 软件 包 ， 该 软 
件 包 针对 的 是 Intel x86 架 构 的 系统 。 

rpm 命 令 还 提供 用 户 与 RPM 系统 交互 的 能 力 。 你 可 以 用 如 下 命令 碍 
询 某 个 软件 包 是 否 已 安装 : 


$ rpm -qa xinetd 


9.6.3 ”创建 RPM 软件 所 


你 可 以 用 命令 rpmbuild 来 创建 一 个 RPM 软件 包 。 创 建 的 过 程 相 对 而 
言 比较 简单 ， 如 下 所 示 。 

O 收集 你 需要 打包 的 软件 。 

O 创建 spec 文 件 ， 该 文件 描述 了 如 何 建立 软件 包 。 

口 用 rpmbuild 命 令 建立 软件 包 。 

由 于 RPM 软 件 包 的 创建 可 能 会 非常 复杂 ， 为 了 便于 说 明 ， 我 们 在 本 
章 中 将 用 一 个 简单 的 例子 来 介绍 ， 该 例子 已 吓 以 说 明 如 何以 源 代码 或 二 
进 制程 序 的 方式 来 发 布 一 般 应 用 软件 。 我 们 将 把 更 深奥 的 选项 和 通过 打 
补丁 的 方式 提供 软件 包 文 持 留 给 有 兴趣 的 读者 来 研究 。 要 想 了 解 更 多 与 
rpm 程 序 相 关 的 信息 ， 请 参考 rpm 程 序 的 手册 页 或 RPM “HOWTO 文 档 

(通常 可 以 在 /usr/share/doc 目 录 下 找到 ) ， 你 还 可 以 参考 由 Eric Foster- 

Johnson 编 写 的 书 《Red Hat RPM 指南 》 (Red Hat Press/Wiley 出 版 〉， 
该 书 的 在 线 版 本 位 于 http://docs.fedoraproject.org/drafts/rpm-guide-en/。 

在 下 面 的 几 小 节 中 ， 我 们 将 按照 上 述 的 3 个 步骤 来 创建 小 应 用 程序 
myapp 的 RPM 软件 包 。 


1. 收 集 软件 


创建 RPM 软件 包 的 第 一 步 是 收集 你 需要 打包 的 软件 。 在 大 多 数 情况 
中 ， 软 件 包括 应 用 程序 的 源 代 人 码 、 一 个 构建 文件 (如 makefile 文 件 〉， 
可 能 还 会 有 一 个 在 线 手册 页 。 

将 软件 所 涉及 的 文件 收集 到 一 起 的 最 简单 的 方法 是 将 所 有 相关 文件 
打包 到 一 个 tarball 文 件 中 ， 并 在 该 文件 的 名 字 中 包含 应 用 程序 名 和 版 本 
号 ， 例 如 myapp-1.0.tar.gz。 

你 可 以 修改 先前 的 makefile 文 件 Makefile6， 在 其 中 增加 一 个 新 的 目 
标 ， 将 所 有 文件 打包 到 一 个 tarball 文 件 中 。 修 改 后 的 makefile 文 件 就 命名 
为 Makefile， 如 下 所 示 : 


all: myapp 


AILID 


myapp-1.0.tar.gz: myapp myapp.1 
rm -rf myapp-1.0 
mkdir myapp~-1.0 
cp *.c *.h *.1 Makefile myapp-1.0 
tar zcvf $% myapp-1.0 


makefile 文 件 中 的 目标 myapp-1.0.tar.gz 将 为 我 们 的 小 应 用 程序 的 源 
代码 创建 一 个 tarball 文 件 。 为 了 使 用 简便 ， 上 面 的 代码 还 在 makefile 文 件 
中 增加 相同 命令 的 dist 目 标 。 你 可 以 运行 如 下 的 命令 来 创建 
tarball 文 件 : 


$ make dist 


接 下 来 ， 你 需要 将 文件 myapp-1.0. tar. gz 复制 到 RPM 的 SOURCES 目 
录 中 ， 对 于 Red Hat Linux 系 统 来 说 ， 该 目录 为 /usr/src/redhat/SOURCES; 
对 于 SUSE Linux 来 说 ， 该 目录 为 /assrc/packages/ SOURCES。 执 行 的 命 
令 如 下 所 示 : 


$ cp myapp-1.0.tar.gz /usr/src/redhat/SOURCES 
RPM 系统 希望 软件 的 源 文件 以 tarball 文 件 的 形式 放置 在 SOURCES 目 
录 中 (当然 还 有 其 他 一 些 选 项 ， 但 这 种 情况 是 最 简单 的 ) 。SOURCES 
目录 只 是 RPM 系 统 所 需要 查找 的 几 个 目录 之 一 。 
RPM 系 统 需要 5 个 目录 的 支持 ， 它 们 列 在 表 9-4 中 。 


表 9-4 


RPM 目录 用 途 
BUILD build 命令 在 这 个 日 录 中 建立 软件 。 
pmbu11d 命 令 拒 它 创 建 的 二 进 制 RPM 软件 包 存 放 在 这 个 目录 中 
休 庶 沪 将 应 用 程序 的 源 文件 存放 在 这 个 目录 中 
你 应 该 为 择 个 准备 建立 的 RPM 软件 包 在 这 个 目录 中 放置 对 应 的 spec 文 件 ， 但 这 并 不 是 必需 的 
命令 格 在 这 个 目 基 中 放置 RPM 浙 代码 软件 氏 


在 RPMS 目 录 下 通常 会 有 一 组 针对 不 同 主机 架构 的 子 目 录 ， 例 如 在 
一 个 Intel x86 架 构 的 系统 中 ，RPMS 目 录 中 的 内 容 如 下 所 示 : 


$ ls RPMS 


默认 情况 下 ，Red Hat Linux 系 统 期 望 在 /usr/src/redhat 目 录 中 创建 
RPM 软 件 包 。 


这 个 目录 是 特定 于 Red Hat Linux 的 。 其 他 Linux 发 行 版 会 使 用 
其 他 的 目录 ， 例 如 /usr/src/ packages. 


一 旦 收集 好 RPM 软 件 包 所 需 的 所 有 源 文件 ， 下 一 步 就 是 创建 spec 文 
件 ， 该 文件 告诉 rpmbuild 命 令 如 何 正确 地 建立 软件 包 。 


2. 创 建 RPM Spec 文 件 


创建 spec 文 件 可 能 会 非常 让 人 晨 惧 ， 因 为 RPM 系统 文 持 的 选项 数 以 
王 计 。 笠 运 的 是 ，RPM 系 统 为 大 多 数 选 项 提供 了 合理 的 默认 值 。 在 本 小 
节 中 所 介绍 的 这 个 简单 例子 中 的 内 容 ， 应 该 能 满足 你 将 要 创建 的 大 多 数 
软件 包 的 需要 了 。 此 外 ， 你 还 可 以 从 其 他 的 spec 文 件 中 复制 你 所 需要 的 


AA 
命令 。 


关于 spec 文 件 的 更 丰富 的 资源 可 以 从 其 他 的 RPM 软件 包 中 找 
到 。 你 可 以 安装 以 。src.， rpm 为 后 级 名 的 RPM 源 代码 软件 包 ， 并 查 
看 其 中 的 spec 文 件 ， 你 会 发 现 比 你 所 需要 的 还 要 复杂 许多 的 例子 ， 
例如 在 软件 包 anonftp、telnet、vnc 和 sendmail 中 的 spec 文 件 都 是 一 些 
比较 有 趣 的 例子 。 


此 外 ，RPM 系 统 的 设计 者 很 聪明 地 未 在 自己 的 系统 中 开发 男 一 套 工 
具 来 取代 常用 的 编译 工具 ， 如 make 或 configure， 而 是 在 系统 中 包含 了 许 
多 短小 的 功能 来 利用 makefile 和 configure 脚 本 文件 。 


在 本 例 中 ， 你 将 为 myapp 应 用 程序 创建 一 个 spec 文 件 myapp.spec。 
ee 版 本 号 以 及 与 软件 包 有 关 的 其 他 信息 的 定 
My DF 下 ZN: 


RPM spec 文 件 中 的 这 部 分 内 容 常 被 称 为 导言 。 在 上 面 的 导言 中 ， 最 
重要 的 定义 是 Name、Version 和 Release。 它 们 在 本 例 中 分 别 被 定义 为 
myapp、1.0 和 1， 其 中 RPM 软件 包 的 版 本 (release) 为 1 是 因为 这 是 你 第 
一 次 尝试 建立 它 。 

Group 定义 的 作用 是 帮助 图 形 化 安装 程序 将 数 生 种 Linux 应 用 程序 分 
类 显示 。Distribution 定 义 软件 的 发 行 方式 ， 当 你 只 是 针对 某 一 个 Linux 
发 行 版 〈 如 Red Hat 或 SUSE Linux) 建立 软件 包 时 ， 它 的 定义 束 显 得 非 
常 重 要 了 。 

在 spec 文 件 中 添加 注释 是 个 好 主意 。 如 同 shell 脚 本 和 makefile 文 件 ， 
rpmbuild 命 令 把 在 该 文件 中 以 字符 # 开 头 的 行 看 作为 和 注释， 例如; 

# This line is a comment.. 

为 了 帮助 用 户 判 断 是 否 需 要 安装 你 的 软件 包 ， 你 可 以 在 spec 文 件 中 
提供 Summary 〈 软 件 的 摘要 ) 和 %description (软件 的 描述 ) ， 注 意 上 述 
两 个 定义 在 语法 上 的 不 一 致 ， 在 description 的 前 面 有 一 个 百 分 号 %。 例 
如 ， 你 可 以 按 如 下 方式 摘 述 你 的 软件 包 : 


y iry aViag. appiication 


al application used to demonstrate development t 
pretends it requires MySQL at or above 3.23. 


Neil Matt 


%description 的 定义 可 以 持续 多 行 〈 通 种 也 是 如 此 ) 。 

spec 文 件 可 以 包含 软件 依赖 关系 的 信息 ， 这 包括 两 方面 的 内 容 : 软 
件 包 提供 了 什么 和 软件 包 依 赖 什 么 《你 还 可 以 定义 源 代码 软件 包 依 赖 什 
么 ， 例 如 指定 编译 软件 时 所 需要 的 特定 头 文件 ) 。 Provides 定 义 了 软件 
包 所 提供 的 功能 ， 例 如 : 


iè 


上 面 这 条 语句 声明 软件 包 定 义 了 一 个 假想 的 功能 goodness。 如 果 没 
有 在 spec 文 件 中 定义 Provides， 则 RPM 系 统 会 自动 添加 Provides 定 义 ， 它 


的 值 为 软件 包 的 name 定 义 ， 在 本 例 中 就 是 myapp。 当 有 多 个 软件 包 提 供 
相同 的 功能 时 ，Provides 定 义 束 非常 有 用 。 例 如 ，Apache Web 服 务 器 软 
件 包 提供 的 功能 十 webserver， 而 其 他 的 软件 包 如 Thy， 它 可 能 也 提供 完 
全 相同 的 功能 。 为 了 帮助 处 理 软 件 包 之 间 的 冲突 ，RPM 还 允许 指定 
Conflicts (冲突 和 Obsoletes GIH) 信息 。 

可 能 最 重要 的 依赖 关系 信息 就 是 Requires 定 义 。 你 可 以 通过 它 定 义 
软件 包 正 常 运 行 所 需 的 所 有 其 他 软件 包 。 例 如 ，Web 服 务 嚣 需要 网 络 和 
安全 软件 包 的 支持 。 在 本 例 中 ， 你 定义 Requires 为 MySQL 数 据 库 ， 版 本 
a Maio EAn ONT: 


如 果 只 ,需要 MySQL 数据 库 的 支持 ， 但 版 本 不 限 ， 那 么 可 以 使 用 如 
tes 


Err Dd ILD aR. pA 
用 户 也 可 以 强制 安装 。 

RPM 系统 还 将 根据 情况 自动 添加 一 些 依赖 关系 定义 ， 如 针对 shell 脚 
本 的 /bin/sh、 针 对 Perl 脚 本 的 Pen 解释 程序 和 应 用 程序 需要 调用 的 任何 共 
享 函 数 库 〈 后 缀 名 为 .so 的 文件 ) 。RPM 系 统 的 每 个 新 版 本 都 会 为 自动 
依赖 关系 检查 添加 更 多 的 智能 。 

定义 完 需 求 后 ， 你 需要 定义 构成 应 用 程序 的 源 文 件 。 对 于 大 多 数 应 
ne 


%fname] 语 法 指 EARN 在 本 例 中 ， 它 指 的 是 软件 包 的 名 
称 。 因 为 你 在 前 面 将 name 定 义 为 myapp， 所 以 rpmbuild 命 令 将 把 % 
{name} 扩 展 为 myapp， 同 样 ，%{version} 将 被 扩展 为 1.0， 这 样 完 整 的 文 
件 名 就 是 myapp-1.0.tar.gz。rpmbuild 命 令 将 在 前 面 提 到 过 的 SOURCES 目 
录 中 查找 这 个 文件 。 

这 个 例子 设置 了 一 个 Buildroot， 它 定义 了 一 个 用 于 测试 安装 的 目 

ue uA i [ai ae Samat 


h} /*{name}-4{ 


设置 好 Buildroot 后 你 vn sre 用 程序 安装 到 Buildroot 定 义 的 目 
录 中 了 。 你 可 以 使 用 变量 $SRPM_BUILD_ROOT 来 引用 它 ， 该 变量 可 以 
在 spec 文 件 中 的 所 有 shell 命 令 中 使 用 。 

在 定义 了 所 有 这 些 与 软件 包 相 关 的 设置 后 ， 下 一 步 就 是 定义 如 何 建 
立 软件 包 了 。 建 立 过 程 一 共 分 为 4 个 主要 的 部 分 : %prep、%build、 
%install 和 %clean。 


顾名思义 ，%prep 部 分 用 于 完成 准备 工作 。 在 大 多 数 情况 下 ， 你 可 
以 运行 宏 %setup， 使 用 -gq 参 数 可 以 将 其 设置 为 安静 模式 ， 如 下 所 示 : 


%build 部 分 用 于 建立 应 用 程序 。 在 大 多 数 情 况 下 ， 你 只 需要 使 用 
make 命 令 ， 如 下 所 示 : 


tbhuild 


| XEHE ARIERPM RSA AEM Clbmakele KPFT A 
种 方式 。 

%install 部 分 用 于 安装 应 用 程序 、 手 册页 和 其 他 支持 文件 。 你 通常 
可 以 使 用 RPM 宏 %makeinstall 来 安装 程序 ， 它 将 调用 在 makefile 文 件 中 定 
义 的 install 目 标 。 但 在 本 例 中 ， 为 了 显示 更 多 的 RPM 宏 ， 你 将 手工 安装 
a 如 下 所 示 : 


tinsta 
r -p $RPM_BUILD_ROOT% {_ bindir} 
r -p $RPM_B ILD_ROOT$ {J mandir) 
1755 myapp $RPM_B TLE _ROOTS eon y rakini 


“这 个 例子 在 需要 的 ti 况 下 将 创建 相应 的 目录 ， 然 后 安装 可 执行 程序 
myapp 和 手册 页 myapp.1。 环 境 变量 $RPM_BUILD_ROOT 包含 先前 定义 
的 Buildroot 的 值 。 宏 %{_bindir} 和 %{_mandir} 将 分 别 被 扩展 为 当前 二 进 
制程 序 目 录 和 手册 页 目录 。 


如 果 用 configure 脚 本 来 创建 makefile 文 件 ， 所 有 可 变 的 目录 名 
你 的 makefile 文 件 中 设置 。 所 以 ， 在 大 多 数 情况 
， 你 不 需 ;要 像 上 面 例子 那样 ， 手 工地 在 spec 文 件 中 指定 所 有 的 安 
A S, 


%clean 目 标 用 于 清理 所 有 由 rpmbuild 命 令 创建 的 文件 ， 如 下 所 示 : 


在 定义 了 如 何 建立 软件 包 后 ， 你 需要 定义 所 有 需要 安装 的 文件 。 
RPM 对 此 要 求 非常 严格 ， 为 了 能 够 正确 地 跟踪 每 个 软件 包 中 的 每 个 文 
件 ， 它 也 必须 如 此 。%files 部 分 定义 了 需要 包括 进 软 件 包 的 所 有 文件 。 
在 本 例 中 ， 你 只 有 两 个 文件 需要 放 在 二 进 制 软件 包 中 发 布 ， 它 们 是 可 执 
行程 序 myapp 和 手册 页 myapp.1。 如 下 所 示 : 


ir} /myapr 


RPM 系统 可 以 在 软件 包 安 装 前 和 安装 后 运行 脚本 程序 。 例 如 ， 如 果 
软件 包 是 一 个 守护 进程 ， 你 可 能 需要 修改 系统 的 初始 化 脚本 来 启动 该 程 
序 。 你 可 以 通过 %post 脚 本 来 完成 这 一 任务 。 下 面 是 一 个 非常 简单 
的 9%post 脚 本 的 例子 ， 它 仅 用 来 发 送 一 封 电子 邮件 : 


tpost 
mail root -s *myapp installed ~ please register" </dev/null 


你 可 以 在 服务 器 RPM 的 spec 文 件 中 看 到 更 多 的 %post 脚 本 的 例子 。 
下 面 是 这 个 小 应 用 程序 的 spec 文 件 的 完整 内 容 : 


# 
è spec file for package myapp (Version 1.0) 
条 
Vendo Wrox Press 
Distribution: Any 
Name myapp 
ersion: 1.0 
Release: l 
Packager: neil@provider.com 
License: Copyright 2007 Wiley Publishing, Inc. 
Group: Applicatrions/Media 
Provides: goodness 
Requires: mysql >= 3.23 
Buildroot: ={_tmppath) /%iname)-*¢{version}-root 
source: tiname})-t(version).tar.gz 
Summary : Trivial application 


tion used to demonstrate development tools. 
it requires MySQL at or above 3.23. 


Richard Stones 


mkdir -p SRPM_BUILD_ROOTt({_bindir) 

mkdir -p SRPM_BUILD_ROOTS{_mandir) 

install -m755 myapp $RPM_BUILD_ROOTt({_bindir} /myapp 
install -m755 myapp.1 SRPM_BUILD_ROOTt{_ mandir) /myapp.1 


rm -rf $RPM_BUILD_ROOT 


mail root -s “myapp installed ~ please register’ </dev/null 
tfiles 


t{_bindir) /myapp 
t{_mandir) /myapp.1 


现在 你 已 准备 好 建立 RPM 软件 包 了 。 
3. 使 用 rpmbuild 命 令 建立 RPM 软件 包 
使 用 rpmbuild 命 令 来 建立 软件 包 的 语法 如 下 所 示 ; 


rpmbuild -bBuildStage spec_file 


选项 -b 告 诉 Ppmbuild 命 令 建 立 一 个 RPM 软件 包 。 附 加 的 选项 
BuildStage 是 一 个 特殊 的 代码 ， 它 的 作用 是 告诉 rpmbuild 命 令 在 建立 时 需 
要 做 到 哪 一 步 。 可 以 使 用 的 选项 如 表 9-5 所 示 。 


表 9-5 


选 项 l A $ 
7 同时 建立 二 进 制 RPM 软件 包 和 源 代 码 RPM 软件 包 
bt 只 建立 二 进 制 RPM 软件 包 
be 内 编译 程序 ， 但 并 不 制作 完整 的 RPM 软 件 包 
bx 为 建立 一 个 二 进 制 RPM 软 件 包 向 好 准备 
创建 二 进 制 RPM 软 件 包 并 且 安装 它 
检查 RPM 软件 包 中 的 文件 列表 
只 建立 源 代码 RPM 软 件 包 


如 果 要 同时 建立 二 进 制 和 源 代码 RPM 软 件 包 ， 就 使 用 选项 -ba。 源 
代码 RPM 软 件 包 允许 你 重新 建立 二 进 制 RPM 软 件 包 。 

将 RPM 的 spec 文 件 复制 到 正确 的 SOURCES 目 录 (放置 应 用 程序 源 
代码 的 目录 ) 中 : 


$ cp myapp.spec /usr/src/redhat/SOURCES 


下 面 显示 了 在 SUSE ”Linux 系 统 中 建立 软件 包 的 输出 结果 软件 包 
spe 目录 /usr/src/ packages 人 SOURCES 建 立 的 ) : 


eevee -ba myapp- DA 


a prep) i -e /var/tmp/rpm-tmp.,47290 
umask 0i 
>d sr c/paci 
i sr/s pac 
m i my a 
usr/bin/ F x packages JRCE app-1i.0.t ar.gz 
ar -xf 
TATUS=0 
[” 0 -ne 
myapp-1 
+ usr/bin/id ~u 
| 000 = 3? 
t bin/id -u 
Y | ` JO = ( by ] 8 
bi hmod -RÉ a+r Wg Ww 
+ exi 
Exec ng i *build) ar/tmp/rpm-tmy 9 
ina 22 
d r/sr ckages/ BUI 
上 -Y ax /tmp/myapp root 
name /va mp/myapp~-1.0-r 
mkdir -p far /tm 


+ /bin/mkdir /var/tmp/myapp-1.0-root 

+ ed myapp-1.9 

+ make 

gcc -g -Wall -ansi -¢ -O MAin.o main.c 

gcc -g -Wall -ansi c -oO 2.0 2.c 

ar rv nyiib.a 2.0 

àr creating mylib.a 

a Ò 

ye c -0 3.o 3.c 
my.id.4 


D myapp main.o 
0 


Executing(tinstall fbin/sh -+e /var/tmp/rpm-tmp.$7320 

+ tmp/myapp-1,0-root/usr/bin 

+ tmp/myapp-1.0-root/usr/share/man 

+ myapp /var/tmp/myapp-1.0-root/usr/bin/myapp 


myapp.1 /var/tisp/myapp-1.0-root/usr/share/man/myapp.1 


var/tmp/myapp-1.0-root 


0 =0 
fyar/tmp/myapp-1.0- 


07-07-09 13:35 
var/tmp/myapp-1.0-root//usr/share/man/myapp.1.gz 
i ownerships - using the permissions files 
1 EN 


setting 


/myapp-1i. 


myapp-1. 


oo 


setting 


/lib/rpm/find-provides myapp 
/lib/rpm/find-requires myapp 
fusr/1ib/rpm/find-supplements myapp 


Requires (i 


PayloadFilesHavePrefix) <= 4.0-1 
ileNames) <= 3,.0.4-1 
libe.so.6 libc.so.6(GLIBC_2.0 


unpackaged file(s fusr/lib/rpm/check-files /var/tmp/myapp-1 


$ src/packages/SRPMS/myapp-1.0-l.sre.rpa 
Wrote: sr/src/packages/RPMS/iS86/myapp-1.0-1.1586. rpm 
Executing (*clean bin/sh -e /var/tmp/rpm-tmp.10065 
+ umask 022 
+ cd /usr/src/packages/BUILD 


+ ca myapp-1.0 
+ rm -rf /var/tmp/myapp-1.0-root 
* exit 0 


O-root 


执行 完 rpmbuild 命 令 后 ， 你 将 看 到 两 个 RPM 软件 包 : 在 RPMS 目 录 
中 的 二 进 制 RPM 软件 包 ， 该 软件 包 放 置 在 相应 的 主机 架构 子 目 录 中 ， 如 
子 目录 RPMS/i586; 在 SRPMS 目 录 中 的 源 代码 RPM 软 件 包 。 


二 进 制 RPM 软 件 包 的 文件 名 将 类 似 下 面 这 


myapp-1.0-1.1586.rpm 
文件 名 中 表示 主机 架构 的 部 分 可 能 会 随 着 


样 : 


系统 的 不 同 而 不 同 。 


源 代 码 RPM 软 件 包 的 文件 名 将 类 似 下 面 这 样 : 


myapp-1.0-1.src.rpm 


你 需要 以 超级 用 户 的 身份 来 安装 软件 包 。 但 在 建立 软件 包 
时 ， 你 并 不 需要 root 的 有 身份 ， 只 要 你 对 RPM 目录 GH 
7e/usr/src/redhat) 有 写 权 限 即 可 。 一 般 情 况 下 ， 你 不 应 该 以 root 
外 丑 份 来 创建 RPM 软 件 包 ， 因为 spec 文 件 中 可 能 会 包含 对 系统 造 
成 破坏 的 命令 。 


9.7 其 他 软件 包 格 式 


虽然 RPM 是 一 种 流行 的 软件 发 布 方式 ， 它 允许 用 户 控 制 软件 的 安装 
和 凶 载 ， 但 目前 还 有 其 他 几 种 具备 苋 争 力 的 软件 包 格 式 。 一 些 软件 仍然 
以 打包 压缩 文件 〈tgz) 的 方式 有 发布 ， 这 些 软件 的 通常 安装 步骤 是 : 首 
ee ee 目录 中 ， 然 后 运行 一 个 脚本 文件 来 执行 真正 
安装。 

Debian 和 基于 Debian 的 Linux 发 行 版 〈 以 及 一 些 其 他 的 Linux 发 行 
版 ) 文 持 另 一 种 软件 包 格 式 dpkg， 它 在 功能 上 和 RPM 类 似 。 它 解 包 和 安 
装 通 香 以 。deb 为 后 缀 的 软件 包 文 件 。 如 果 需 要 以 。deb 软 件 包 格式 来 发 
布 软件 ， 你 可 以 用 工具 Alien 将 RPM 软件 包 转 换 为 dpkg 格 式 。 有 关 Alien 
的 更 多 资料 请 参考 http://kitenet.net/programs/alien/。 


9.8 “环境 


目前 为 止 ， 我 们 在 本 章 中 介绍 的 几乎 所 有 工具 基本 上 都 是 命令 行 工 
具 。 具 有 在 Windows 系 统 上 开发 经 验 的 程序 员 旦 无 疑问 都 有 使 用 集成 开 
发 环境 ADE) 的 经 历 。IDE 是 一 个 图 形 化 的 环境 ， 它 通 芝 会 将 用 于 创 
建 、 调 斌 和 运行 应 用 程序 的 部 分 或 所 有 工具 集成 到 一 起 。 它 一 般 至 少 会 
提供 一 个 编辑 器 、 一 个 文件 浏览 器 和 一 种 运行 应 用 程序 并 捕获 其 输出 结 
果 的 方法 。 更 完整 的 开发 环境 还 会 文 持 从 模板 中 为 特定 类 型 的 应 用 程序 
生成 源 代 码 文件 ， 集 成 源 代 码 控制 系统 和 上 自动 生成 文档 。 

在 下 面 几 节 中 ， 我 们 将 介绍 KDevelop 及 其 他 一 些 可 在 Linux 上 运行 
的 IDE。 这 些 IDE 都 正 处 于 积极 的 开发 过 程 中 ， 其 中 一 些 最 高 级 的 IDE 已 
有 具备 与 商业 软件 匹敌 的 质量 。 


9.8.1 KDevelop 


KDevelop HF C#IC++FE FF WIDE. ‘EIS 77 EK MIA 
(KDE) 中 的 应 用 程序 的 开发 提供 特别 的 文 持 ，KDE 是 当前 Linux 系 统 
中 两 大 主流 图 形 用 户 界 面 之 一 。KDevelop 还 可 用 于 开发 其 他 类 型 的 项 
目 ， 包 括 简 单 的 C 语 言 程序 。 

KDevelop 是 一 个 自由 软件 ， 它 是 根据 GNU 通 用 公共 许可 证 (GPL) 
的 条 球 发 布 的 ， 许 多 Linux 发 行 版 都 提供 了 该 软件 。 你 可 以 从 http: 
//Wwww.kdevelop.org 上 下 载 它 的 最 新 版 本 。 通 过 KDevelop 开 发 的 项 目 在 
默认 情况 下 都 遵循 GNU 项 目的 标准 。 例 如 ， 它 们 将 使 用 autoconf 工 具 来 
生成 makefile 文 件 ，autoconf 将 根据 编译 该 软件 的 系统 环境 来 自动 调整 
makefile 文 件 的 内 容 。 这 意味 着 项 目 可 以 以 源 代码 的 方式 发 布 ， 并 且 很 
有 可 能 能 够 在 其 他 系统 中 编译 通过 。 

使 用 KDevelop 开 发 的 项 目 还 包含 用 于 制作 文档 的 模板 、GPL 许 可 证 
文本 和 通用 的 安装 说 明 。 在 制作 新 的 KDevelop 项 目 过 程 中 产生 的 大 量 文 
件 可 能 会 令 使 用 者 非 背 晨 惧 ， 但 如 果 你 曾经 下 载 并 编译 过 一 个 典型 的 
GPL 应 用 程序 ， 那 么 就 不 会 对 这 些 文 件 感 到 陌生 了 。 

KDevelop 文 持 CVS 和 Subversion 的 源 代码 控制 ， 应 用 程序 可 以 在 不 
离开 IDE 环 境 的 情况 下 被 编辑 和 调试 。 图 9-2 和 图 9-3 显 示 了 编辑 和 执行 
一 个 默认 的 KDevelop C 语 言 应 用 程序 〈 这 是 另 一 个 Hello World! 程序 ) 
的 情况 。 
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9.8.2 其 


目前 还 有 许多 其 他 的 编辑 器 和 IDE (自由 软件 和 商业 软件 ) 可 以 用 
在 Linux 系 统 中 ， 或 正 处 于 开发 阶段 。 其 中 一 些 比较 有 趣 的 软件 列 在 表 


9-64, 


开发 环境 


e TE 
NE 


K 9-6 


类 ë 


Eclipse 
Anjuta 
QIEZ 
SlickEdit 


基于 Java 的 工具 平台 和 IDE 
个 GNOME IDE 
个 KDE IDE 
个 商业 版 本 的 多 语言 代码 编辑 器 


产品 URL 
http://www.eclipse.org 
hitp://anjuta.sourceforge.netv/ 
hitp://projects. uid0, sk/qtez/ 


hitp://www,slickedit.comy 


9.9 小结 


在 本 章 中 ， 你 看 到 了 一 些 Linux 开 发 工具 ， 它 们 使 程序 的 开发 和 发 
布 更 容易 管理 。 首 先 ， 你 使 用 make 和 makefile 文 件 来 管理 多 个 源 文件 ， 
这 也 是 本 章 最 重要 的 内 容 。 然 后 ， 你 学 习 了 如 何 通 过 RCS 和 CVS 来 控制 
源 代 码 ， 它 们 可 以 让 你 在 开发 代码 的 过 程 中 对 各 种 改动 进行 跟踪。 接 下 
来 ， 你 学 习 了 如 何 通过 patch 命 令 、 带 有 gzip 压 缩 功 能 的 tar 命 令 和 RPM 软 
件 包 来 发 布 软件 。 最 后 ， 你 学 习 了 一 个 IDE 工 具 KDevelop， 它 可 以 让 编 
辑 一 运行 一 调试 这 个 开发 周期 变 得 更 容易 一 些 。 


10 调 试 


根据 美国 软件 工程 学 会 和 IEEE 的 研究 ， 每 个 里 要 的 软件 最 急 孝 
会 有 缺陷 。 一 般 来 说 ， 每 100 行 代码 会 有 两 个 左右 的 错误 。 这 些 错误 将 
导致 程 序 和 函数 库 无 法 按照 需要 的 方式 执行 ， 这 通常 会 造成 程序 的 实际 
执行 情况 和 预期 的 情况 不 同 。 在 软件 开发 过 程 中 ， 查 找 、 识 别 和 纠正 这 
些 错误 将 耗费 程序 员 大 量 的 时 间 。 

在 本 章 中 ， 我 们 将 研究 软件 的 缺陷 ， 并 介绍 一 些 工 具 和 技术 来 捕捉 
错误 行为 的 特定 实例 。 这 与 程序 测试 (以 各 种 可 和 出现 的 条 
序 操作 情况 ) 是 不 同 鸭 ， 虽 然 测试 和 调试 密切 相关 ， 并 且 许 多 错误 正 
在 测试 阶段 被 发 现 的 。 

在 本 半 中 ， 我 们 将 介绍 下 面 一 些 主题 : 
错误 类 型 
常用 调试 技巧 
eee 进行 调试 
断言 
内 存 调试 


中 口 口 口 口 字 


10.1 和 错误 类 型 


有 几 种 原因 会 造成 程序 的 缺陷 ， 针 对 每 种 原因 ， 我 们 都 有 下 面 一 些 
建议 的 方法 用 来 查找 和 纠正 。 
O 功能 定义 错误 : 如 宋 程 序 的 功能 被 错误 地 定义 了 ， 它 区 肯定 不 
能 完成 预定 的 工作 。 即 使 是 世界 上 最 优秀 的 程序 员 ， 有 时 也 会 写 出 
错误 的 程序 。 所 以 ， 在 开始 程序 设计 《或 规划 ) 之 前 ， 你 必须 确认 
自己 知道 并 理解 这 个 程序 究竟 是 用 来 干什么 的 。 认 真 分 析 用 户 需 求 
并 加 强 和 用 户 之 间 的 沟通 ， 有 助 于 但 找 和 纠正 许多 (即使 不 是 全 
部 ) 程序 功能 定义 方面 的 错误 。 
O 设计 规划 错误 : 无 论 程序 规模 的 大 小 ， 在 创建 它们 之 前 都 需要 
设计 规划 。 在 计算 机 键盘 前 坐 下 ， 直 接 融 入 源 代 码 ， 然 后 期 望 程序 
能 一 次 通过 ， 这 样 的 情况 并 不 第 见 。 对 程序 员 来 说 ， 一 定 要 多 花 点 
时 间 思 考 : 如 何 构造 程序 ， 需 要 什么 样 的 数据 结构 ， 它 又 应 该 如 何 
在 程序 中 使 用 。 尽 量 把 这 些 细节 问题 提前 确定 下 来 ， 这 样 将 节省 今 
后 很 多 改写 代码 的 时 间 。 
O 代码 编写 错误 当然 ， 每 个 人 都 会 出 现 键入 错误 。 根 据 设 计 来 
创建 源 代 码 的 过 程 并 不 是 一 个 不 会 出 错 的 完美 过 程 ， 许 多 程序 错误 
都 是 在 这 一 阶段 悄悄 潜入 的 。 在 程序 中 过 到 错误 时 ， 要 重新 阅读 源 
代码 或 与 其 他 人 进行 探讨 ， 这 个 办 法 虽然 因为 简单 而 容易 被 人 忽 
视 ， 但 它 却 非 常 有 效 。 你 肯定 会 对 目 己 通过 与 他 人 探讨 程序 的 有 具体 
实现 而 能 够 查找 并 纠正 的 错误 之 多 感到 惊讶 。 


像 C 语 言 这 样 带 有 编译 器 的 程序 设计 语言 有 一 个 优点 ， 它 的 
语法 错误 可 以 在 编译 阶段 检查 出 来 。 而 对 于 解释 型 的 语言 ， 如 
Linux shell， 则 只 能 在 程序 的 运行 阶段 才能 发 现 语法 错误 。 如 果 
问题 出 在 程序 的 错误 处 理 代码 部 分 ， 则 即使 在 程序 的 测试 阶段 ， 
也 不 容易 发 现 它 。 


O 可 以 试 着 在 纸 上 执 行程 序 的 核心 代码 ， 这 个 过 程 通常 被 称 为 空 
运行 (dry running〉。 针 对 那些 非常 重要 的 例 程 ， 先 记 下 它们 的 输 
入 值 ， 然 后 逐步 手工 计算 出 输出 结果 。 调 试 程序 并 不 一 定 非 要 用 计 
算 机 不 可 ， 有 时 ， 问 题 可 能 正 是 因为 计算 机 本 喘 才 出 现 的 。 即 使 是 
编写 函数 库 、 编 译 器 和 操作 系统 的 程序 员 也 会 犯错 误 。 可 话 又 说 回 
来 ， 也 不 要 一 出 问题 就 抱 候 工 具 ， 新 程序 出 现 错 误 的 可 能 性 要 比 编 
译 器 大 得 多 。 


目前 有 几 种 典型 的 调试 和 测试 Linux 程 序 的 方法 。 一 般 做 法 是 先 运 
行程 序 并 观察 其 输出 结果 ， 如 果 不 能 正常 工作 ， 我 们 就 需要 决定 应 该 采 
取 哪 些 措施 。 可 以 修改 程序 然后 重新 尝试 (代码 检查 - 试 运 行 -出 错 
法 ) ， 也 可 以 在 程序 中 增加 一 些 语 句 来 获得 更 多 关于 程序 内 部 运行 情况 
的 信息 (取样 法 ) ， 还 可 以 直接 检查 程序 的 执行 情况 〈 受 探 执行 法 ) 。 
程序 调试 可 以 分 为 如 下 5 个 阶段 。 

测试 : 找 出 程序 中 存在 的 缺陷 或 错误 。 
固化 : 让 程序 的 错误 可 重 现 。 

EM: 确定 相关 的 代码 行 。 

纠正 : 修改 代码 纠正 错误 。 

验证 : 确定 修改 解决 了 问题 。 


Fa 
已 


我 们 先 来 看 一 个 有 漏洞 的 示例 程序 。 在 本 章 中 ， 我 们 将 对 其 进行 调 
试 。 这 个 程序 是 在 某 大 型 软件 系统 的 开发 过 程 中 编写 的 ， 其 作用 是 测试 
函数 sort， 该 函数 的 功能 是 通过 冒 泡 排序 算法 对 一 个 类 型 为 item 的 结构 
数组 进行 排序 ， 有 具体 的 排序 方法 为 基于 结构 中 的 成 员 key 以 升序 排列 数 
组 成 员 。 程 序 用 一 个 样本 数组 来 测试 函数 sort。 在 现实 中 ， 我 们 可 能 水 
远 也 不 会 使 用 这 个 算法 ， 因 为 它 的 执行 效率 实在 太 低 了 。 在 这 里 使 用 这 
gag cera: ABMS Re fal A E, m HEER A H 

。 事 实 上 ， 在 标准 的 C 函 数 库 中 已 经 有 一 个 完成 同样 功能 的 函数 qsort 


”糟糕 的 是 ， 这 个 程序 的 可 读 性 比较 差 ， 里 面 没 有 任何 注释 ， 也 不 知 
道 最 初 的 程序 员 是 哪 一 位 ， 所 以 一 切 只 能 靠 我 们 自己 了 。 先 从 基本 的 例 
程 debug1. i dd 的 内 容 : 


ali) = alije 


我 们 来 编译 这 个 程序 : 
$ cc -o debugl debugl .c 
编译 过 程 很 顺利 ， 既 无 出 错 信息 也 无 警告 信息 
运行 这 个 程序 之 前 ， 我 们 需 # 要 在 程序 中 添加 一 些 代码 来 打印 出 结 


果 ， 人 否则 就 不 会 知道 这 个 程序 是 否 正 常 工作 了 。 这 些 代码 的 作用 是 显示 
8 名 为 debug2.c， 如 下 所 示 : 


printf ("array ld) « ts, $d)\n", 
arra t rray([i)}.key); 


严格 来 说 ， 这 些 额外 的 代码 并 不 属于 程序 员 的 职责 范围， 加 上 它 完 
全 是 因为 测试 工作 的 需要 。 添 加 这 些 代 码 时 ， 我 们 必须 非常 小 心 以 避免 
在 训 试 代码 中 引入 新 的 漏洞 。 现 在 ， 再 次 编译 ， 然 后 运行 程序 : 


$ cc -o debug2 debug2.c 
5 ./debug2 


这 样 做 产生 的 输出 结果 取决 于 你 所 使 用 的 Linux (或 UNIX) 版 本 及 
其 其 体 设置 悄 况 。 在 我 的 系统 上 运行 它 时 ， 得 到 的 输出 结果 是 : 


array 


但 它 在 本 书 另 一 位 作者 的 系统 《运行 的 是 另 一 个 版 本 的 Linux 内 


核 ) 上 运行 时 ， 给 出 的 输出 却 是 这 样 : 
Segmentation fault 


在 你 的 Linux 系 统 中 运行 这 个 程序 时 ， 你 可 能 会 看 到 其 中 一 种 输出 
结果 ， 或 者 完全 不 同 的 为 外 一 个 输出 结果 。 而 我 们 希望 看 到 的 输出 是 : 


很 明显 ， 这 上 段 代码 存在 着 很 严重 的 问题 。 即 使 它 能 运行 ， 给 出 的 排 
序 结果 也 是 错误 的 。 如 果 它 的 运行 产生 段 错误 (segmentation fault) 而 
被 终止 ,就 说 明 操 作 系 统 同 程序 发 送 了 一 个 信和 号， 告诉 程序 操作 系统 检 
测 到 了 非法 的 内 存 访问 ， 为 防止 内 存 空间 被 破坏 ， 操 作 系统 提前 终止 了 
该 程序 的 运行 。 

操作 系统 检测 非法 内 存 访问 的 能 力 ， 取 决 于 它 的 人 硬件 配置 和 它 在 内 
存 管理 实现 方面 的 一 些 具 体 做 法 。 在 大 多 数 系 统 中 ， 操 作 系 统 分 配给 程 
序 的 内 存 一 般 都 会 比 程序 实际 需要 使 用 的 大 一 些 。 如 果 非 法 内 存 访问 出 
现在 这 部 分 内 存 区 域内 ， 硬 件 就 可 能 检测 不 到 ， 这 就 是 并 非 所 有 版 本 的 
Linux 和 UNIX 系 统 都 会 产生 段 错误 的 原因 。 


有 的 库 函 数 《比如 printft) 在 菏 些 特殊 情况 下 《比如 使 用 了 一 
个 空 指针 ) 也 会 阻止 非法 访问 操作 的 发 生 。 


如 果 想 捕捉 到 数组 访问 方面 的 错误 ， 最 好 增加 数组 元 素 的 大 小 ， 因 
为 这 样 同 时 也 增加 了 错误 的 大 小 。 如 果 只 是 在 数组 的 结尾 之 后 读 取 一 个 
字 节 ， 我 们 很 可 能 会 看 不 到 有 错误 发 生 ， 因 为 分 配给 程序 的 内 存 大 小 会 
取 整 到 操作 系统 的 特定 边界 ， 一 般 分 配 的 内 存 大 小 以 8K 为 单位 递增 。 

如 果 增 加 数组 元 素 的 大 小 ， 比 如 在 此 例 中 将 item 结 构 中 的 成 员 data 
扩大 为 一 个 可 以 容纳 4 096 个 字符 的 数组 ， 对 不 存在 的 数组 元 素 进 行 访 
问 时 ， 内 存 地 址 就 有 可 能 落 在 分 配给 这 个 程序 的 内 存 之 外 的 地 方 。 因 为 
数组 的 每 个 元 素 大 小 为 4K， 所 以 我 们 错误 使 用 的 内 存 将 落 在 数组 结尾 
之 后 的 OK 一 4K 范 围 内 。 

如 果 这 样 做 ， 并 将 修改 后 的 程序 命名 为 debug3.c， 它 将 在 两 位 作者 
的 Linux 系 统 上 都 产生 段 错误 。 如 下 所 示 : 


2 char da 
ec -ọ debug} debug3.c 
$ ./debug3? 


但 还 是 存在 着 这 样 的 可 能 性 ， 即 茶 些 Linux 或 UNIX 版 本 仍然 不 会 产 


生 段 错误 。 当 C 语 言 的 ANSI 标 准将 茶 种 行为 定义 为 "未 定义 ?时 ， 实 际 上 
它 还 是 允许 程序 运行 的 。 现 在 看 来 ， 我 们 所 写 的 这 个 C 语 言 程序 是 不 合 
规范 的 ， 而 且 这 个 不 合 规范 的 C 语 言 程序 可 能 会 表现 出 非常 奇怪 的 行 

为 ! 我 们 将 看 到 这 个 错误 确实 残 属于 刚才 所 说 的 “未 定义 ”行为 的 范 晓 。 


10.2.2 ”代码 检查 


先前 已 经 提 到 过 ， 当 程序 的 运行 情况 和 预期 不 同时 ， 最 好 重新 阅读 
程序 。 根 据 本 章 的 学 习 目 的 ， 我 们 假设 程序 代码 已 经 被 检查 过 ， 那 些 比 
较 明 显 的 错误 也 都 已 经 被 排除 了 。 


代码 检查 这 一 术语 还 用 于 一 种 更 加 正式 的 场合 : 一 组 开发 人 员 
逐 字 逐 句 的 检查 数 百 行 的 代码 。 但 代码 本 号 的 规模 大 小 其 实 并 不 重 
要 ， 它 仍然 是 代码 检查 并 且 是 一 个 非常 有 用 的 技巧 。 


有 些 工 具 可 以 帮助 你 完成 代码 检查 工作 ， 编 译 占 就 是 其 中 比较 明显 
的 一 个 。 如 果 程 序 有 语法 错误 ， 它 就 会 告诉 你 。 


有 些 编译 器 还 有 用 来 针对 可 疑 行为 产生 报警 的 选项 ， 比 如 未 
对 变量 进行 初始 化 、 在 条 件 判断 里 使 用 赋值 操作 等 。 举 例 来 说 ， 
GNU 编 译 器 在 运行 时 可 以 使 用 下 面 这 些 选 项 。 


fal pedanti -ansi 


这 些 选 项 将 局 用 许多 警告 和 其 他 检查 来 检验 程序 是 否 符 合 C 语 
言 标准 。 我 们 建议 大 家 养 成 使 用 这 些 选 项 的 习惯 ， 特 别 是 -Wall 选 
项 。 在 追踪 程序 的 错误 时 ， 它 可 以 产生 非常 有 用 的 信息 。 


我 们 将 在 稍 后 介绍 lint 和 splint 等 工具 。 与 编译 嚣 一样， 它们 对 源 代 
人 码 进 行 分 析 并 报告 可 能 不 正确 的 代码 。 


10.2.3 FY 
取样 法 是 指 在 程序 中 添加 一 些 代 码 以 收集 更 多 与 程序 运行 时 的 行为 


相关 的 信息 的 方法 。 取 样 法 的 常见 做 法 是 ， 在 程序 中 添加 printf 函 数 调 
用 以 打印 出 变量 在 程序 运行 的 不 同 阶 段 的 值 ， 如 同 我 们 在 上 面 的 例子 中 


所 做 的 那样 。 我 们 可 以 添加 多 个 printf 函 数 调用 ， 但 需要 注意 ， 无 论 何 
时 程序 发 生 了 改动 ， 这 一 过 程 都 将 带 来 更 多 的 编辑 和 编译 次 数 ， 而 且 ， 
在 程序 错误 被 修复 后 ， 我 们 还 要 把 这 些 额 外 的 代码 删除 掉 。 

在 这 里 可 以 使 用 两 种 取样 法 的 技巧 。 第 一 种 技巧 是 用 C 语 言 的 预 处 
理 句 有 选择 地 包括 取样 代码 ， 这 样 只 需 重 新 编译 程序 就 可 以 包含 或 去 除 
调试 代码 。 实 现 方法 非常 简单 ， 只 需 使 用 如 下 的 语句 结构 : 


在 编译 程序 时 可 以 加 上 编译 器 标志 -DDEBUG。 如 果 加 上 这 个 标 
志 ， 就 定义 了 DEBUG 符 号 ， 从 而 可 以 在 程序 中 包含 额外 的 调试 代码 ; 
如 果 未 加 上 该 标志 ， 这 些 调试 代码 将 被 删除 。 我 们 还 可 以 用 数值 调试 宏 
来 完成 更 复杂 的 调试 应 用 ， 如 下 所 示 : 


在 这 种 情况 下 ， 我 们 必须 总 是 定义 DEBUG 宏 ,但 我 们 可 以 设置 它 
为 代表 一 组 调试 信息 或 代表 一 个 调试 级 别 。 比 如 编译 器 标志 - 
DDEBUG=5 将 启用 BASIC_DEBUG 和 SUPER_DEBUG， 但 不 包括 
EXTRA_DEBUG。 标 志 -DDEBUG=0 将 禁用 所 有 的 调试 信息 。 另 外 ， 也 
可 以 在 程序 中 添加 如 下 语句 。 这 样 ， 当 不 需要 调试 时 ， 束 不 必 在 命令 行 
上 定义 DEBUG 宏 : 


$ifndef DEBUG 


C 语 言 预 处 理 器 定义 的 一 些 宏 可 以 帮助 我 们 进行 调试 。 这 些 宏 在 扩 
展 后 会 提供 当前 编译 操作 的 相关 信息 ， 如 表 10-1 所 示 。 


表 10-1 


eh, Re SWAD 
注意 ， 这 些 符号 的 前 后 各 有 两 个 下 划 线 ， 这 是 标准 的 预 处 理 器 符号 


通常 的 做 法 ， 你 应 该 注意 避免 选择 可 能 会 与 它们 冲突 的 符 写 。 上 面 说 明 
中 的 术语 当前 指 的 是 预 处 理 操作 正在 执行 的 那 一 时 刻 ， 即 正在 运行 编译 


器 对 文件 进行 处 理 时 的 时 间 和 日 期 。 


实 验 调试 信息 
请 看 下 面 这 个 程序 cinfo.c， 如 果 在 编译 它 时 启用 了 调试 ， 就 会 打印 
出 编译 时 的 日 期 和 时 间 : 


llo worlid\n*); 


编译 这 个 程序 时 启用 调试 〈 用 -DDEBUG) ， 我 们 将 看 到 如 下 所 示 
的 编译 信息 : 


$ cc -o cinfo -DDEBUG cinfo.c 
$ ./cinfo 
-ODL2 i: Jur 5 


试验 解析 

作为 编译 器 的 一 部 分 的 C 语 言 预 处 理 器 跟踪 记录 正在 编译 的 当前 文 
件 和 文件 中 的 当前 行 。 当 它 在 代码 中 遇 到 符号 _LINE_ 和 _FILE 时， 就 
将 它们 蔡 换 为 这 些 变量 的 当前 值 〈 编 译 时 刻 ) ， 对 编译 日 期 和 时 间 的 处 
理 也 与 此 相同 。 因 为 DATE_ 和 _TIME 都 是 字符 串 ， 所 以 我 们 可 以 用 
printf 疯 数 的 格式 字符 串 把 它们 连 在 一 起 ，ANSI “C 标 准 定义 相 邻 的 字符 
串 可 以 被 看 作为 一 个 字符 串 。 


无 需 重 新 编译 的 调试 技巧 

在 继续 学 习 新 的 内 容 之 前 ， 我 们 先 介 绍 一 个 使 用 printf 函 数 帮 助 调 
试 的 技巧 ， 它 的 好 处 是 无 需 使 用 好 fdef DEBUG 语 句 ， 后 者 还 需要 重新 编 
译 才 能 开始 对 程序 进行 调试 。 

方法 是 在 程序 中 增加 一 个 作为 调试 标志 的 全 局 变量 ， 这 使 得 用 户 可 
以 在 命令 行 上 通过 -d 选 项 切换 是 否 局 用 调试 模式 ， 即 使 程序 已 经 发 布 
了 ， 仍 然 可 以 这 样 做 ， 该 方法 同时 还 会 在 程序 中 增加 一 个 用 于 记录 调试 
信息 的 函数 。 现 在 我 们 可 以 把 如 下 的 内 容 加 入 到 程序 代码 中 : 


你 应 该 将 调试 信息 输出 到 标准 错误 输出 stderr， 或 者 ， 如 果 因 为 程 
序 的 原因 不 能 这 样 做 ， 你 还 可 以 使 用 syslog 函 数据 供 的 日 志 功 能 。 

如 采用 这 种 调试 方法 来 解决 程序 开发 过 程 中 的 问题 ， 你 可 以 将 这 些 
代码 一 直 留 在 程序 中 。 只 要 你 比较 谨慎 在 意 ， 这 样 做 将 是 相当 安全 的 。 
它 的 好 处 体现 在 ， 当 程序 及 布 之 后 ， 如 果 用 户 遇 到 了 问题 ， 他 们 自己 就 
可 以 在 运行 程序 时 打开 调试 功能 ， 目 己 完 成 诊断 错误 的 工作 。 在 出 现 问 
题 时 除了 报告 段 错误 外 ， 它 们 还 可 以 报告 出 当时 程序 正在 做 什么 ， 而 不 
仅 是 用 户 本 人 正在 做 什么 。 这 两 者 之 间 的 区 别 还 是 很 明显 的 。 

当然 ， 这 样 做 也 有 一 个 明显 的 不 足 ， 就 是 程序 的 长 度 会 有 所 增加 。 


但 在 大 多 数 情况 下 ， 它 只 是 一 个 表面 问题 ， 算 不 上 是 实际 意义 上 的 问 

题 。 程 序 的 长 度 可 能 会 增加 20% 或 30%， 但 往往 并 不 会 对 程序 的 性 能 造 
ed a 
能 的 降低 。 


现在 回 到 示例 程序 ， 该 程序 有 一 个 漏洞 ， 我 们 可 以 修改 程序 ， 增 加 
一 些 代码 把 变量 在 程序 运行 时 的 值 打印 出 来 ， 或 者 还 可 以 用 调试 器 来 控 
制程 序 的 执行 ， 随 时 查看 这 些 变量 的 状态 。 

商业 UNIX 系 统 中 有 许多 可 用 的 调试 器 ， 能 用 哪些 调试 器 取决 于 厂 
商 。 常 见 的 有 adb、sdb、idebug 和 dbx。 较 复杂 的 调试 器 可 以 在 源 代码 级 
别 查 看 程序 的 比较 详细 的 状态 信息 。GNU 的 调试 器 gdb 〈 可 以 在 Linux 和 
许多 类 UNIX 系 统 中 使 用 ) 就 可 以 做 到 这 一 点 。 目 前 有 一 些 针对 gdb 
的 “前 端 ? 程 序 ， 它 们 提供 非常 友好 的 用 户 界面 ，xxgdb、KDbg 和 ddd 都 
是 这 样 的 程序 。 一 些 IDE， 比 如 我 们 在 第 9 章 介绍 的 ， 也 提供 了 调试 功能 
或 一 个 用 于 gdb 的 前 端 。Emacs 编 辑 器 甚至 还 提供 了 一 个 功能 Cedb- 
mode) ， 人 允许 用 户 在 程序 上 运行 gdb， 设 置 断 点 并 查看 现在 执行 到 源 代 
码 中 的 哪 一 行 。 

为 了 能 够 调试 程序 ， 我 们 需要 在 编译 它 时 加 上 一 个 或 多 个 特殊 的 编 
译 器 选项 。 这 些 选项 的 作用 是 让 编译 器 在 程序 中 添加 额外 的 调试 信息 。 
这 些 信息 包括 各 种 符号 和 源 代 人 码 行 号 ， 调 试 器 将 利用 这 些 信息 向 用 户 显 
示 程 序 已 经 执行 到 源 代码 的 位 置 。 

-g 标 志 是 对 程序 进行 调试 性 编译 时 常用 的 一 个 选项 。 我 们 必须 在 编 
译 每 个 需要 调试 的 源 文件 时 都 加 上 这 个 选项 ， 对 链接 器 也 要 这 样 做 ( 编 
译 器 会 把 这 个 标志 自动 传递 给 链接 器 ) ， 它 将 使 用 特殊 版 本 的 C 语 言 标 
准 库 以 提供 库 函 数 中 的 调试 支持 。 对 那些 在 编译 时 没有 加 上 调试 功能 的 
函数 库 ， 虽 然 调试 工作 也 能 够 进行 ， 但 灵活 性 就 要 差 些 。 


调试 信息 的 加 入 将 使 可 执行 程序 的 长 度 成 倍增 加 《最 高 可 达到 10 
倍 ) 。 尽 管 可 执行 程序 的 容量 可 能 增加 了 《并 且 占 用 了 更 多 的 磁盘 衬 
间 ) ， 但 程序 运行 时 所 需要 的 内 存 数 量 还 是 和 原来 一 样 。 程 序 调试 结束 
后 ， 最 好 还 是 将 调试 信息 从 程序 的 发 行 版 本 中 删除 。 

你 可 以 用 命令 strip <file> 将 可 执行 文件 中 的 调试 信息 删除 而 不 需要 
重新 编译 程序 。 


我 们 将 使 用 GNU 的 调试 器 gdb 调 试 这 个 程序 。gdb 是 一 个 功能 很 强大 
的 调试 器 ， 它 是 一 个 自由 软件 ， 能 够 用 在 许多 UNIX 平 台 上 。 它 同时 也 
是 Linux 系 统 中 的 默认 调试 器 。gdb 已 被 移植 到 许多 其 他 的 计算 机 平台 
上 ， 并 且 能 够 用 于 调试 散 入 式 实时 系统 。 


10.3.1 zgdb 


现在 ， 对 我 们 的 示例 程序 进行 调试 性 编译 并 局 动 gdb， 如 下 所 示 : 


gdb 有 详细 的 在 线 帮助 ， 它 的 完整 使 用 手册 由 一 组 文件 构成 ， 可 以 
通过 info 程 序 或 Emacs 程 序 查 阅 。 如 下 所 示 : 


70D) help 


Running 


wands related to "word" 


gdb 本 身 是 一 个 基于 文本 的 应 用 程序 ， 但 它 为 一 些 重复 性 的 任务 准 
备 了 一 些 快捷 键 。gdb 的 许多 版 本 都 具备 带 历史 记录 的 命令 行 编辑 功 
能 ， 用 户 可 以 《党 试用 方向 键 ) 回 卷 并 再 次 执行 以 前 输入 过 的 命令 。 它 
的 所 有 版 本 都 支持 “ 空 命令 *， 即 直接 按 下 回 车 键 再 次 执行 最 近 执 行 过 的 


那 条 命令 。 在 用 step 或 next 命 令 单 步 执行 程序 时 ， 这 个 “ 空 命令 ?非常 有 
用 。 
要 退出 gdb， 使 用 quit 命 令 即 可 。 


10.3.2 运行 一 个 程序 


我 们 可 以 用 run 命 令 来 执行 这 个 程序 。 在 run 命 令 中 给 出 的 所 有 参数 
aa 我 们 的 程序 无 需 任 何 参 


在 这 里 ， 我 们 假设 你 的 系统 和 本 书 两 位 作者 的 一 样 ， 都 产生 了 段 错 
Re 如 打 情 况 并 非 如 些 ， 请 继续 往 下 看 。 如 果 在 编写 自己 的 程序 时 过 到 
ct 误 ， 在 学 完 本 章 后 就 应 该 知道 如 何 解决 它 了 。 如 条 没有 遇 到 过 段 
错误 ， 但 还 想 在 阅读 本 书 时 继续 使 用 这 个 示例 程序 ， 你 可 以 直接 跳 到 
到 那 时 我 们 已 把 这 个 程序 的 第 一 个 内 存 访问 错误 修复 好 


与 前 面 一 样 ， 这 个 程序 运行 不 正确 。 程 序 运行 失败 时 ，gdb 会 报告 
出 失败 的 原因 及 位 置 。 现 在 我 们 即 可 根据 这 些 调查 这 个 问题 的 根本 原 
Kl. 


根据 你 的 操作 系统 内 核 、C 函 数 库 和 编译 器 版 本 的 具体 情况 ， 你 可 
能 会 看 到 程序 的 错误 发 生 在 一 个 稍微 不 同 的 地 点 ， 比 如 发 生 在 交换 数组 
元 素 的 第 25 行 而 不 是 发 生 在 比较 数组 元 素 成 员 key 的 第 23 行 。 如 果 你 是 
属于 这 种 情况 ， 则 应 该 看 到 如 下 所 示 的 输出 结果 : 


不 管 你 是 否 属 于 这 种 情况 ， 你 部 可 以 沿 着 我 们 的 gdb 样 本 示例 继续 
学 习 。 


10.3.3 跟踪 
程序 停止 在 源 文 件 debug3.c 的 第 23 行 ， 该 行 位 于 Sort 函数 中 。 如 果 我 


们 在 编译 程序 时 没有 添加 调试 信息 〈cc- g) 就 无 法 看 到 程序 失败 时 所 
停 的 位 置 ， 也 无 法 用 变量 名 来 检查 数据 。 


我 们 可 以 用 backtrace 命 令 来 查 出 程序 是 如 何 到 达 这 一 位 置 的 ， 如 下 


这 是 一 个 非常 简单 的 程序 ， 因 为 我 们 并 未 在 其 他 的 函数 中 调用 很 多 
函数 ， 所 以 跟踪 信息 也 很 少 。 你 可 以 看 到 ，sort 函 数 是 由 同一 个 文件 中 
的 main 函 数 在 第 37 行 调用 的 。 通 党 在 实际 工作 中 过 到 的 问题 要 复杂 得 
多 ，backtrace 命 令 将 帮助 我 们 找到 程序 到 达 错 误 地 点 的 路 径 。 当 调试 的 
函数 可 能 会 从 许多 不 同 的 地 方 被 调用 时 ， 这 个 命令 将 非常 有 用 。 

backtrace 命 令 可 以 简写 为 bt， 为 了 与 其 他 调试 器 兼容 ，gdb 还 有 一 个 
命令 where 用 来 完成 相同 的 功能 。 


10.3.4 KETE 


gdb 在 停止 程序 时 给 出 的 信息 以 及 从 跟踪 栈 得 到 的 信息 可 以 让 我 们 
看 到 函数 参数 的 取 值 。 
sort 函 数 被 调用 时 有 一 个 参数 a， 它 的 取 值 是 0x804a040。 这 是 数组 
的 地 址 ， 在 不 同 的 系统 中 这 个 值 通常 是 不 一 样 的 ， 这 要 视 用 户 使 用 的 编 
译 占 和 操作 系统 而 定 。 
昔 误 出 现在 第 23 行 ， 该 行 对 数组 的 两 个 元 素 进行 比较 ， 如 下 所 示 : 


ifl(afj].key > a[j+1].key 


我 们 可 以 用 调试 器 检查 函数 参数 、 局 部 变量 和 全 局 数据 的 内 容 。 
print 命 令 的 作用 就 是 给 出 变量 和 其 他 表达 式 的 内 容 ， 如 下 所 示 : 


7db) print j 


我 们 看 到 局 部 变量 j 的 值 是 4。gdb 会 用 伪 变 量 来 保存 类 似 这 样 的 输 
出 值 以 备 后 用 。 这 里 就 将 值 4 赋 给 了 了 伪 变 量 $1， 后 续 的 命令 将 把 它们 的 
输出 结果 依次 保存 到 $2、$3 等 中 去 。 

局 部 变量 j 的 值 是 4 意味 着 程序 尝试 执行 的 是 这 样 一 条 命令 : 


if(a[4].key > a[4+1].key) 


PA VEU ZF sort AA BZA array RAS IcR, ENN FERMOS. 
因此 ， 这 条 语句 读 的 是 一 个 不 存在 的 数组 元 素 array [5]。 循 环 计数 器 变 
量 j 取 了 一 个 错误 的 值 。 

如 果 执 行 这 个 示例 程序 时 ， 程 序 停 在 了 第 25 行 ， 就 说 明 系 统 是 在 准 


备 交 换 数组 元 素 时 才 检 测 到 读数 组 越界 错误 的 ， 第 25 行 执行 的 语句 是 : 
ie | iad | a[]] = al]+l]; 

当 j 取 值 为 4 时 ， 真 正 执行 的 是 这 样 一 条 语句 : 

a[4] = a[4+1]; 


我 们 可 以 用 Print 命令 的 表达 式 来 得 看 处 理 过 的 数组 元 素 。gdb 人 允许 
T 
取 值 。 


(gdb) print ar[3] 
{data = "alex" 


”gdb 将 命令 的 结果 保存 在 伪 变 量 $<number> 中 。 最 后 一 次 操作 的 结果 
总 是 为 陪 ， 倒 数 第 二 次 操作 的 结果 为 $$。 这 使 得 我 们 可 以 把 某 次 操作 的 
结果 用 在 另 一 个 命令 中 。 例 如 ， 


gdb) print a[$-1].key 


10.3.5 Finke va 


我 们 可 以 直接 在 gdb 里 用 1list 命 令 列 出 程序 的 源 代 码 。 这 个 命令 会 打 
印 出 围 经 当前 位 置 前 后 的 一 段 代 码 ， 如 果 继 续 使 用 list 命 令 ， 将 显示 
多 的 代码 。 你 也 可 以 给 list 命 令 提供 一 个 行 写 或 函数 名 作为 参数 ， 它 将 
显示 指定 位 置 前 后 的 代码 。 


sdb) list 


我 们 可 以 看 到 在 第 22 行 ， 循 环 被 设置 为 在 变量 j 小 于 n 时 继续 执行 。 
而 在 本 例 中 ，n 等 于 5， 所 以 变量 j 的 最 大 取 值 为 4。 当 j 取 值 为 4 时 ， 参 加 
比较 的 数组 元 素 分 别 为 a[4] 和 a[5]。 对 这 一 特定 问题 的 一 种 解决 方法 
是 ， 将 终止 循环 的 条 件 改正 为 ] < n-1. 


我 们 对 程序 做 出 修改 ， 将 新 的 程序 命名 为 debug4.c， 重 新 编译 并 运 


Te: 


~ 


2 os for(j = 0; 
ce -g -0 debug4 debug4é.c 
. /debug4 


程序 的 运行 仍然 不 正常 ， 因 为 它 输出 的 是 错误 的 排序 列表 。 下 面 我 
们 用 gdb 对 程序 的 运行 做 单 步调 试 。 


10.3.6 We Woe 


为 了 找 出 程序 失败 的 位 置 ， 我 们 需要 能 够 查看 程序 在 运行 时 所 做 的 
事情 。 我 们 可 以 通过 设置 断 点 在 任 一 位 置 停止 程序 的 运行 。 这 将 中 断 程 
序 的 运行 并 将 控制 权 返 回 给 调试 器 。 然 后 我 们 即 可 对 变量 进行 检查 并 让 
程序 从 断 点 位 置 继续 执行 。 

在 sort 函数 中 有 两 个 循环 。 外 层 循环 针对 每 个 数组 元 素 执行 一 次 ， 
它 的 循环 计数 变量 是 i。 内 层 循环 的 作用 是 交换 相 令 的 两 个 元 素 。 总 的 
效果 是 让 比较 小 的 元 素 像 “气泡 ”一 样 “ 冒 ”到 数组 的 顶部 。 外 层 循 环 每 执 
行 一 次 ， 数 组 中 最 大 的 元 素 就 会 “下 沉 ” 到 数组 的 底部 。 我 们 可 以 通过 在 
外 层 循环 中 停止 程序 的 运行 并 检查 数组 的 状态 来 核实 这 一 点 。 

有 许多 命令 可 以 用 来 设置 断 点 。 用 gdb 的 help breakpoint 命 令 可 以 列 
出 这 些 命令 ， 如 下 所 示 : 


jab) help breakpoint 


在 第 21 行 设置 一 个 断 点， 然后 运行 这 个 程序 SF BRAS: 


aD run 


我 们 可 以 打印 出 数组 元 素 的 值 ， 然后 用 cont 命 令 继续 执行 程序 。 程 
序 会 一 直 运 行 直到 它 遇 到 下 一 个 断 点 ， a a 
FENIR- 在 同一 时 间 程 序 中 可 以 存在 许多 个 断 点 。 


i print array[0] 


ETPA 去 的 数据 项 ， 我 们 可 以 使 用 aiunias 让 sd 果 
印 出 指定 数目 的 数组 元 素 。 如 果 要 把 数组 中 的 所 有 元 素 都 打印 出 来 ， 使 
用 的 命令 如 下 所 示 : 


ib) print array[0)@5 


JER: 我 们 对 输出 # 果 做 了 些 整理 ， e 因为 这 是 
第 一 次 进入 循环 ， 所 以 数组 未 发 生变 化 。 继 续 执行 程序 ， 随 着 程序 的 进 
展 ， ] 将 看 到 数组 array 的 后 续 变 化 : 


nt 


fab) print array(0)@5 


“我 们 可 以 用 display 命 令 告诉 gdb， 在 每 次 程序 停 在 断 点 位 置 时 自动 
显示 数组 的 内 容 ， 如 下 所 示 


i display ray [0 wee 


此 外 ， 我 们 可 以 修改 断 点 设置 ， 使 程序 不 是 在 断 点 处 停 下 来 ， 而 只 
是 显示 要 查看 的 数据 ， 然 后 继续 执行 。 我 们 用 commands 命 令 来 完成 这 
一 工作 。 它 的 作用 是 指定 在 程序 到 达 断 点 位 置 时 需要 执行 的 调试 器 命 
令 。 因 为 我 们 已 设置 了 display 人 命令， 所 以 只 需 设 置 断 点 命令 为 继 绢 ERAT 
即 可 。 如 下 所 示 : 


jib) commands 


现在 ， 当 程序 继续 执行 时 ， 它 将 一 直 执行 到 结束 ， 外 层 循 环 每 次 执 
行 都 会 打印 出 数组 的 内 容 ， 如 下 所 示 : 


“gdb 报告 这 个 程序 在 退出 时 带 有 一 个 不 常见 的 退出 码 ， 这 是 因为 程 
序 本 身 未 调用 exit 函 数 ， 并 且 也 没有 从 main 函 数 返回 一 个 值 。 本 例 中 的 
退出 码 没 有 实际 意义 ， 只 有 exit 函 数 才 会 提供 有 意义 的 退出 码 。 


看 上 去 程序 执行 外 部 循环 的 次 数 少 于 预期 值 。 我 们 可 以 看 到 ， 循 环 
终 正 条 件 中 使 用 的 参数 n 的 值 在 每 次 到 达 断 点 时 都 在 减少 。 这 意味 痢 循 
环 不 会 执行 足够 的 次 数 。 问 题 出 在 程序 的 第 30 行 ， 该 行 对 变量 n 做 了 减 
法 操作 ， 如 下 所 示 : 


上 面 这 行 语句 是 出 于 优化 程序 的 考虑 ， 每 次 外 部 循环 结束 时 ， 数 组 
array 中 最 大 的 元 素 将 被 放 到 数组 的 最 底部 ， 所 以 下 一 次 执行 外 部 循环 时 
束 没 有 必要 考虑 数组 的 最 后 一 个 元 系 了 。 但 是 ， 正 如 我 们 所 看 到 的 ， 这 
个 优化 措施 影响 了 外 部 循环 并 引发 了 问题 。 针 对 这 一 问题 的 最 简单 的 解 
决 方法 (当然 还 有 其 他 方法 ) 残 是 删除 引起 问题 的 一 行 。 下 面 我 们 就 通 
过 用 调试 器 打上 补丁 的 方法 来 解决 ， 看 看 是 否 能 成 功 。 


我 们 已 经 看 到 ， 我 们 可 以 通过 调试 嚣 设置 断 点 和 查看 变量 的 取 值 。 
通过 将 断 点 的 设置 与 相应 的 操作 结合 起 来 ， 就 可 以 尝试 修改 程序 (也 被 
称 为 打 补 丁 〉 而 不 需要 改变 程序 的 源 代码 并 重新 编译 。 在 本 例 中 ， 我 们 
需要 在 程序 的 第 30 行 中 断 程序 ， 增 加 变量 n 的 值 ， 这 样 ， 程 序 执行 到 第 
30 行 时 ，n 的 值 并 未 发 生变 化 。 

重新 开始 执行 这 个 和 程序。 首先， 必须 删除 刚才 设置 的 断 点 和 display 
命令 的 内 容 。 我 们 可 以 用 info 命 令 查 看 曾经 设置 过 的 断 点 及 display 命 令 
的 内 容 ， 如 下 所 示 : 


info display 


我 们 可 以 禁用 这 些 设置 ， 也 可 以 将 其 全 部 删除 。 如 果 禁 用 它们 ， 我 
们 就 可 以 在 今后 必要 的 时 候 重新 启用 这 些 保留 的 设置 ， 如 下 所 示 : 


jab} disable break 1 
rab) disable display 1 
Jâb) break 30 


jab) commands 2 


"Set variable n = n+l 
-cont 

end 

jab) run 


Program exited with code 025, 


程序 一 直 运 行 到 结束 并 给 出 了 正确 的 结果 。 我 们 现在 即 可 对 源 代 码 
进行 修改 并 用 更 多 的 数据 对 它 进 行 测试 了 。 


GNU 调 试 右 是 一 个 功能 非常 强大 的 工具 ， 它 可 以 为 我 们 提供 许多 与 
执行 中 的 程序 的 内 部 状态 有 关 的 信息 。 在 文 持 便 件 断 点 功能 的 系统 上 ， 
可 以 用 gdb 实 时 监控 变量 取 值 的 变化 情况 。 硬 件 断 点 是 茶 些 CPU 提供 的 
功能 ， 这 些 处 理 需 可 以 在 触发 茶 个 特定 条 件 《〈 一 般 为 对 茶 个 给 定 区 域 的 
内 存 访 问 操 作 ) 时 目 动 停止 运行 。 此 外 ，gqdb 还 可 以 监控 表达 式 ， 即 当 
某 个 表达 式 取 了 一 个 特定 值 时 ，gdb 可 以 暂停 程序 的 运行 ， 而 不 管 表 达 
式 的 计算 发 生 在 程序 中 的 位 置 ， 但 这 样 做 会 对 系统 的 性 能 有 上 所 影 啊 。 

断 扣 可 以 和 计数 、 条 件 结合 在 一 起 设置 ， 只 有 在 经 过 了 指定 的 次 数 
或 满足 某 个 条 件 时 才 触 发 断 点 。 

gdb 还 可 以 将 其 目 身 附 在 已 经 运行 的 程序 上 。 这 对 调试 客户 /服务 露 
系统 很 有 帮助 ， 因 为 你 可 以 在 异常 服务 占 正 在 运行 时 对 其 进行 调试 ， 而 


不 必 先 停止 它 ， 然 后 再 重启 它 。 你 可 以 在 编译 程序 时 用 如 gcc -o -g 这 样 
的 命令 来 同时 获得 程序 优化 和 调试 信息 的 好 处 。 但 这 样 做 的 缺点 是 ， 优 
化 可 能 会 对 程序 代码 的 先后 顺序 进行 调整 ， 因 此 ， 在 对 代码 进行 单 步调 
ee ere E R 
\ ay ò 

我 们 还 可 以 用 gdb 来 调试 已 经 有 骨 尝 的 程序 。 程 序 运 行 失败 时 ，Linux 
和 UNIX 系 统 通常 会 产生 一 个 核心 转 储 (core dump) ， 并 将 它 保 存在 
core 文 件 中 。 这 个 文件 其 实 是 程序 的 内 存 映像 文件 ， 它 包含 程序 在 运行 
失败 的 那个 时 刻 的 全 局 变量 的 取 值 。 你 可 以 用 gdb 找 出 程序 发 生 朋 尝 的 
位 置 。 详 细 的 资料 请 查阅 gdb 的 手册 页 。 

gdb 遵 守 GPL 的 条 款 ， 大 多 数 UNIX 系 统 都 支持 它 。 我 们 强烈 建议 读 
者 掌握 这 一 工具 。 


10.4 ”其 他 调试 工具 


除了 像 gdb 这 样 彻底 的 调试 器 外 ，Linux 系 统一 般 还 会 提供 许多 能 够 
帮助 你 完成 调试 工作 的 其 他 工具 。 其 中 有 的 是 提供 关于 程序 的 静态 信 
息 ， 男 外 一 些 则 是 提供 动态 分 析 。 

静态 分 析 只 能 通过 程序 的 源 代码 提供 信息 。ctags、cxref 和 cflow 等 
就 是 一 些 静 态 分 析 程 序 ， 它 们 可 以 通过 源 文件 提供 有 关 函 数 调用 和 函数 
所 在 位 置 的 有 用 信息 。 

动态 分 析 提 供 的 是 与 程序 执行 过 程 中 的 行为 有 关 的 信息 。prof 和 
gprof 等 就 是 一 些 动态 分 析 程 序 ， 它 们 提供 的 信息 包括 已 经 执行 了 哪些 函 
数 以 及 这 些 函 数 的 执行 时 间 。 

下 面 我 们 将 介绍 其 中 一 些 工 具 及 其 输出 。 虽 然 这 些 工 具 中 的 大 部 分 
ooo 以 免费 获得 的 版 本 ， 但 并 非 在 所 有 的 系统 中 都 可 以 使 用 所 有 这 些 
TA. 


10.4.1 lint: 清理 程 Shi” 


器 的 一 个 前 端 ， 但 增加 了 一 些 常 识 性 的 测试 并 可 以 产生 一 些 警 告 信息 。 
它 可 以 检测 出 未 经 赋值 的 变量 使 用 、 函 数 的 参数 未 使 用 等 情况 。 

最 新 的 C 语 言 编译 器 也 可 以 产生 类 似 的 警告 信息 ， 但 这 是 以 损失 编 
译 过 程 的 性 能 为 代价 的 。lint 本 号 已 经 东 后 于 C 语 言 的 标准 化 工作 了 ， 
为 这 个 工具 是 基于 早期 的 C 语 言 编译 器 开发 的 ， 它 已 不 能 很 好 地 处 理 
ANSI C 的 语法 了 。lint 有 一 些 适 用 于 UNIX 系 统 的 商业 版 本 ， 在 因特网 上 
至 少 有 一 个 版 本 是 针对 Linux 系 统 的 ， 它 的 名 字 是 splint， 过 去 党 把 它 称 
ALClint, ‘EAEMIT (PRA EET AGE) 的 为 正式 规范 开发 工具 软件 这 一 
项 目的 组 成 部 分 。 类 lint 工 具 splint 可 以 提供 有 用 的 代码 审查 注释 ， 该 软 
件 可 以 在 http:/www.splint.org 上 找到 。 

下 面 这 个 程序 是 我 们 前 面 调试 过 的 示例 程序 的 早期 版 本 

(debug0.c) : 


这 个 版 本 在 第 20 行 有 一 个 问题 ， 它 使 用 的 是 操作 符 & 而 不 是 &&。 
针对 这 个 版 本 的 splint 示 例 和 输出 经 过 编辑 后 显示 在 下 面 。 注 意 它 是 如 何 
发 现 第 20 行 的 问题 的 一 一 程序 没有 初始 化 变量 s， 而 且 这 个 不 正确 的 操 
作 符 可 能 会 给 条 件 测试 布 来 问题 。 


neil@susel03;~/BLP4e/chapterl0> splint -strict debug0.c 
Splint 3.1.1 --- 19 Mar 2005 


debug0.c:7:18: Read-only string-literal storage used as initial value for 
unqualified storage: array[0].data = *bill" 
A read-only string literal is assigned to a non-observer reference. (Use 
-readonlytrans to inhibit warning} 
debug0.c:8:18: Read-only string literal storage used as initial value for 
unqualified storage: array[{1).data = "neil" 
debug0.c:9:18: Read-only string literal storage used as initial value for 
unqualified storage: array[(2].data = *john" 
debug0.c:10:18: Read-only string literal storage used as initial value for 
unqualified storage: array[3].data = "rick" 
dGebug).c:11:18: Read-only string literal storage used as initial value for 
unqualified storage: array[4].data = "lex" 
Gebug).c:14:22: Old style function declaration 
Function definition is in old style syntax. Standard prototype syntax is 
preferred. (Use -oldstyle to inhibit warning) 
debug0.c: (in function sort) 
debug0.c:20:31: Variable s used before definition 
An rvalue is used that may not be initialized to a value on some execution 
path, (Use -usedef to inhibit warning) 
Gebug0.¢c:20:23; Left operand of & is not unsigned value (boolean): 
i<naé&s !=0 
An operand to a bitwise operator is not an unsigned values. This may have 
unexpected results depending on the signed representations. (Use 
-bitwisesigned to inhibit warning) 
dGebug0.c:20:23: Test expression for for not boolean, type unsigned int: 
i<né&s !2#0 
Test expression type is not boolean or int. (Use -predboolint to inhibit 
warning) 
debug0.¢c:25:41: Undocumented modification of al]: alj] = alj + 1) 
An externally-visible object is modified by a function with no /*Gmodifies#*/ 
comment. The /*@modifies ... 9*/ control comment can be used to give a 
modifies list for an unspecified function. (Use -modnomods to inhibit 
warning) 
debug0.c:26:41: Undocumented modification of a[]: alj +1) = t 
debug0.c:20:23: Operands of & are non-integer (boolean! [in post loop test): 
i<en&s !2 0 
A primitive operation does not type check strictly. (Use -stricteps to 
inhibit warning) 
debug0.c:32:14: Path with no return in function declared to return int 
There is a path through a function declared to return a value on which there 
is no return statement. This means the execution may fall through without 
returning a meaningful result to the caller. {Use -noret to inhibit warning) 
debug0.c:34:13: Function main declared without parameter list 


splint 工 具 抱 怨 程 序 中 有 老式 的 〈 非 ANSI 标 准 ) 函数 声明 ， 并 且 函 
数 返回 类 型 与 它们 真正 的 返回 值 〈 或 没有 返回 值 ) 不 一 致 。 这 些 虽 不 影 
响 程 序 的 执行 ， 但 应 该 引起 注意 。 它 还 发 现 了 两 个 真正 的 漏洞 ， 它 们 出 
现在 下 面 这 段 代 码 中 : 


int 6; 


splint 发 现 《〈 前 面 输出 中 的 阴影 部 分 ) 第 20 行 使 用 的 变量 s 未 经 初始 
化 ， 并 且 在 该 行 应 该 使 用 更 常见 的 操作 符 &&& 而 不 是 现在 使 用 的 操作 符 
&. 在 本 例 中 ，& 操 作 符 改变 了 测试 的 含义 ， 确 实 是 这 个 程序 存在 的 一 
问题 。 


这 些 错误 都 在 调试 开始 之 前 的 代码 审查 阶段 就 得 到 了 修复 。 虽 然 它 


们 是 我 们 为 了 演示 而 有 意 放 在 那里 的 ， 但 在 真正 的 程序 中 ， 这 些 错 误 可 
以 说 是 屡见不鲜 。 


ctags, cxref 和 cflow 这 3 个 工具 构成 了 X/Open 规范 的 一 部 分 内 容 ， 
此 ， 有 具备 软件 开发 能 力 的 UNIX 系 统 都 会 有 这 3 个 工具 。 


这 些 工 具 以 及 本 章 介 绍 的 其 他 一 些 工 具 可 能 没有 o 的 
Linux 发 行 版 中 。 如 果 是 这 样 ， 你 就 需要 在 因特网 上 搜索 它们 。 
较 好 的 搜索 网 站 (对 文 持 RPM 软 件 包 格 式 的 Linux 发 行 版 来 说 是 
http://rpmfind.net 和 http://rpm.pbone.net。 你 还 可 以 尝试 一 些 友 行 版 
特定 的 软件 库 ， 如 针对 openSUSE 的 
http://ftp.gwdg.de/pub/opensuse/、 和 针对 Fedora 的 http://rpm.livna.org 和 
针对 Slackware 的 http://packages.slackware.it/. 


1.ctags 


ctags TEP PRANA ee Ba EZR | o BED EA BOT IM TIRE, TES 
ee PRAIA SG]. Pie CIA 
法 : 


st a 况 下 ， ctags 在 当前 目录 下 创建 文件 tags。 在 该 文件 中 包含 每 
a iim HH Aoo PK — A 的 格式 如 下 所 示 : 


文件 中 的 aE 由 函数 名 、 声 声明 该 了 数 的 文件 和 一 个 可 以 用 来 在 文件 
中 查找 该 函数 定义 的 正则 表达 式 组 成 。Emacs 等 编辑 器 可 以 用 这 类 文件 
来 帮助 程序 员 浏 览 源 代 码 。 

此 外 ， 还 可 以 使 用 ctags 的 -x 选项 (如 果 你 使 用 的 版 本 有 该 选项 ) 在 
标准 输出 上 列 出 类 似 上 面 格式 的 内 容 : 

find_cat 403 app_ui.c static cdc_entry find_cat( 

你 可 以 用 -f 选 项 将 输出 重 定 向 到 为 一 个 不 同 的 文件 中 ， 也 可 以 用 -a 
选项 将 输出 结果 附加 到 一 个 已 有 文件 的 结尾 。 


2.cxref 


cxref 程 序 分 析 C 语 言 源 代码 并 生成 一 个 交叉 引用 表 。 它 可 以 显示 每 
个 符号 (变量 、#define 定 义 和 函 数 ) ee 程序 的 哪个 位 置 使 用 过 。 它 生 
成 的 是 一 个 经 过 排序 的 列表 ， 每 个 符号 的 定义 位 置 用 一 个 星 号 〈*) 做 
标记 ， 如 下 所 示 : 


BASENTI 


在 我 的 机 器 上 ， 上 面 的 输出 结果 是 在 一 个 应 用 程序 的 源 代码 目录 中 
产生 ， 使 用 的 命令 如 下 所 示 : 

$ cxref *.c*. h 
但 这 个 命令 的 正确 语法 格式 随 版 本 的 不 同 而 不 同 。 请 参考 系统 文档 或 手 
册页 来 了 解 cxref 命 令 的 更 多 信息 。 


3.cflow 


cflow 程 序 打印 出 一 个 函数 调用 树 (function call tree) , EAN J A 
数 之 则 调用 的 关系 。 它 可 以 让 我 们 看 清楚 一 个 程序 的 框架 结构 ， 理 解 它 
的 操作 流程 ， 了 解 对 某 个 函数 的 改动 将 会 产生 怎样 的 影响 。 有 些 版 本 的 
cflow 除 了 可 以 处 理 源 代码 外 ， 还 可 以 处 理 目 标 文 件 。 详 细 的 用 法 请 参 
考 它 的 手册 页 。 

下 面 是 cflow 版 本 2.0 的 一 些 样本 输出 ， 该 版 本 可 以 从 因特网 上 得 
到 ， 它 由 Marty Leisner 负 责 维护 : 


这 个 输出 样本 告诉 我 们 : main 函 数 调用 show_all_lists 函 数 〈 以 及 其 
他 一 些 函 数 ) ,show_all lists 又 调用 了 display_list， 而 display_list 本 喘 调 
H Y printf. 

这 个 版 本 的 cflow 有 一 个 -i 选项 ， 它 将 产生 一 个 反 同 的 函数 调用 树 。 
针对 每 个 函数 ，cflow 列 出 调用 它 的 其 他 函数 。 听 起 来 好 像 很 复杂 ， 但 
实际 上 很 简单 ， 下 面 是 一 个 样本 。 


我 们 可 以 看 出 都 有 哪些 函数 调用 了 exit 函 数 ， 它 们 是 main、 


show_all_lists 和 usage. 
10.4.3 rof/gprof;” 行 存 档 


想 查 找 程序 的 性 能 问题 时 ， 一 种 常用 的 技巧 是 使 用 执行 存档 
(execution profiling〉。 它 通常 需要 特殊 的 编译 器 选项 和 辅助 程序 的 文 
程序 的 执行 存档 可 以 显示 执行 它 所 花费 的 时 间 上 有 具体 都 用 在 什么 操作 
y 


编译 程序 时 ， 给 编译 器 加 上 -p 标 志 〔 针 对 prof 程 序 ) -pgri CEF 
对 gprof 程 序 ) 就 可 以 创建 出 profile 程 序 。 而 prof 程 序 〈( 及 其 GNU 等 效 程 
序 gprof〉 可 以 根据 profile 程 序 运 行 时 所 产生 的 执行 跟踪 文件 打印 出 一 个 
报告 。 编 译 命令 如 下 所 示 : 

$cc -pg -0 program program. c 

程序 用 特殊 版 本 的 C 语 言 函 数 库 链 接 起 来 并 且 将 包括 监控 代码 。 不 
同 的 系统 具体 实现 方法 有 所 不 同 ， 但 一 般 都 要 靠 程 序 的 频繁 中 断 来 记录 
执行 地 点 。 监 控 数 据 将 被 写 入 当前 目录 下 的 文件 mon.out (gprof 程 序 用 
的 是 gmon.out) 。 如 下 所 示 : 


. {program 
ls -is 


prof/gprof 程 序 读 取 监 控 数 据 并 生成 一 个 报告 。 程 序 选 项 的 细节 请 参 
考 它 的 手册 页 。 下 面 是 一 些 〈《 有 所 删节 ) gprof 程 序 的 输出 示例 : 


cumilative self self total 


time seconds seconds calls ms/call ms/call name 
18.5 0.10 0.10 S666 0.01 0.03 _doscan [4] 
18.5 0.20 0.10 meount (60) 
14.8 0.28 0.08 43320 0.00 0.00 „number [5] 
9.3 0.33 0,05 B66 0.01 0.01 —format_arg [6] 
7.4 0.37 0.04 122632 0.00 0.00 _ungete [8] 
7.4 0.41 0,04 8757 0.00 0.00 _memcecpy [9] 
7.4 0.45 0.04 1 40.00 390.02 main (2) 
3.7 0.47 0.02 53 0.38 0.38 read [12] 
3.7 0.49 0.02 wéstr [10] 
Lia 0.50 0.01 26034 0.00 0.00 -strlen [16] 
1.9 0.51 0.01 8664 0.00 0.00 strncmp [17] 


10.5 Whe 


在 软件 的 开发 过 程 中 ， 通 过 条 件 编译 引入 printf 调 用 等 调试 代码 的 
做 法 是 很 常见 的 ， 但 一 般 不 会 在 发 行 版 本 中 保留 这 些 信 息 。 然 而 经 第 会 
出 现 这 样 的 情况 ， 程 序 运行 中 出 现 的 问题 与 不 正确 的 假设 有 关 而 并 非 代 
码 的 错误 。 这 些 不 正确 的 假设 往往 是 被 主观 认为 不 会 及 生 的 事件 。 例 
如 ， 人 们 在 编写 函数 时 会 认为 它 的 输入 参数 应 该 位 于 一 个 确定 的 范围 
内 ， 但 万 一 给 它 传 递 了 不 正确 的 数据 ， 就 可 能 造成 整个 系统 运行 不 正 
常 。 

系统 的 内 部 多 辑 需要 被 确认 没有 错误 。 针 对 这 种 情况 ，X/Open 提 供 
了 assert 宏 ， 它 的 作用 是 测试 某 个 假设 是 否 成 立 ， 如 果 不 成 立 束 停 止 程 
序 的 运行 。 


#include <assert.h> 


assert 宏 对 表达 式 进行 求 值 ， 如 果 结 果 非 零 ， 它 就 往 标 准 错误 写 一 
些 诊断 信息 ， 然 后 调用 abort 函 数 结束 程序 的 运行 。 

头 文件 asserth 定 义 的 宏 受 NDEBUG 的 影响 。 如 果 程 序 在 处 理 这 个 头 
文件 时 已 经 定义 了 NDEBUG， 就 不 定义 assert 宏 。 这 意味 着 ， 你 可 以 在 
编译 期 间 使 用 -DNDEBUG 关 闭 断 言 功能 或 把 下 面 这 条 语句 |: 


加 到 每 个 源 文 件 中 ， 但 这 条 语句 必须 放 在 ##include <assert.h> 语 句 之 前 。 

assert 宏 的 这 种 用 法 带 来 一 个 问题 。 如 果 在 测试 阶段 使 用 assert， 但 
在 发 行 版 本 中 将 其 关闭 ， 那 你 的 发 行 版 本 代码 在 安全 检测 方面 束 比 你 对 
它 进 行 测试 时 要 差 一 些 。 但 在 产品 代码 中 保留 assert 通 常 是 不 可 取 的 
难道 你 愿意 用 户 在 使 用 你 的 软件 时 在 屏幕 上 显示 一 条 不 友好 的 
assert _ failed 错误 提 示 ， 然 后 就 退出 程序 吗 ? 针对 这 个 问题 的 比较 好 的 解 
决 方法 是 ， 编 写 上 自己 的 错误 中 断 陷阱 例 程 ， 在 该 例 程 中 进行 断言 ， 但 不 
需要 在 产品 代码 中 完全 禁用 该 功能 。 

你 还 必须 注意 不 要 让 assert 表 达 式 带 上 副作用 。 例 如 ， 如 果 使 用 了 
带 有 副作用 的 函数 调用 ， 这 个 副作用 在 删除 了 断言 功能 的 产品 代码 中 整 
不 会 再 发 生 了 。 


实 验 assert 
下 面 这 个 程序 assert.c 定 义 了 一 上 函数 ， 它 的 参数 必须 是 一 个 正 数 。 
它 用 断言 功能 来 保护 自己 不 受 非 法 参数 的 影 啊 。 


AREY H WAMA Me Fasserth, AELAD, 1% 
检查 目 己 的 参数 是 否 为 正 数 ， 最 后 是 main 函 数 。 如 下 所 示 : 


finclude <math 


现在 ， 运 行 这 个 程序 时 ， 如 果 给 my- sqrt 函数 传递 了 一 个 非法 值 ， 
你 就 会 看 到 一 个 断言 冲突 错误 。 错 误 信 息 的 格式 将 随 系统 的 不 同 而 不 
同 。 


实验 解析 

当 我 们 试图 用 一 个 负数 来 调用 函数 my_sqrt 时 ， 上 断言 失败 了 。assert 
宏 给 出 了 发 生 断 言 冲 突 的 文件 名 和 行 号 ， 还 给 出 了 失败 的 条 件 。 程 序 被 
一 个 abort 中 断 陷 阱 终止 了 运行 ， 这 就 是 assert 调 用 abort 的 结果 。 

如 果 用 -DNDEBUG 选 项 重新 编译 这 个 程序 ， 上 断言 功能 将 被 排除 在 
编译 结果 之 外 。 当 在 my _ sqrt Pa CrP i H sqrt ea SCAN 得 到 的 将 是 一 个 
NaN 值 (不 是 一 个 数字 ) ， 表 明 一 个 无 效 结 果 ， 如 下 所 示 : 


ce -0O assert -DNDEBUG assert.c -lm 
> -/assert 


ECT BRI SL ERRER AEGEAN IND RP AE PS 
终止 并 返回 一 个 类 似 Floating point exception 的 消息 ， o 回 一 个 
NaN. 


10.6 内存 调运 


动态 内 存 分 配 是 一 个 很 容易 出 现 程 序 漏洞 的 领域 ， 而 且 一 旦 漏洞 出 
现 ， 还 很 难 查 找 。 如 果 在 程序 中 用 malloc 和 free 函 数 来 分 配 内 存 ， 你 就 
必须 清楚 自己 分 配 过 的 每 一 块 内 存 ， 并 且 要 确定 没有 使 用 已 经 释放 的 内 
存 块 ， 这 一 点 非常 重要 。 

内 存 块 通常 都 是 由 malloc 函 数 分 配给 指针 变量 的 。 如 果 指 针 变 量 的 
取 值 发 生 了 变化 ， 又 没有 其 他 指针 指向 这 块 内 存 ， 这 块 内 存 就 变 得 无 法 
访问 。 这 就 是 一 种 内 存 泄漏 现象 ， 它 将 导致 程序 的 长 度 不 断 增 加 。 如 果 
泄漏 了 大 量 内 存 ， 系 统 就 会 越 来 越 慢 ， 最 终 耗 尽 内 存 。 

如 果 在 一 个 已 分 配 的 内 存 块 尾部 的 后 面 〈 或 在 它 头 部 的 前 面 ) 写 数 
据 ， 就 很 可 能 会 损坏 malloc 库 用 于 记录 内 存 分 配 情 况 的 数据 结构 。 出 现 
这 种 情况 后 ， 经 过 一 段 时 间 ， 一 个 malloc 调 用 ， 甚 至 是 一 个 free 调 用 都 
会 引发 段 错 误 并 导致 程序 骨 尝 。 要 想 查 出 错误 发 生 的 准确 地 点 是 非常 困 
MEN, LAVAGE UR BY REE TE S| ACEP AH SEZ AIBA REN 

BAER, An OAA a DAA Be Rik AR i TAY, 
既 有 商业 版 本 的 也 有 免费 版 本 的 。malloc 和 free 函 数 也 有 许多 不 同 的 版 
本 ， 其 中 一 些 版 本 包含 了 额外 的 代码 ， 用 于 检查 内 存 分 配 和 内 存 释 放 情 
况 ， 以 解决 诸如 一 个 内 存 块 被 释放 了 两 次 以 及 其 他 类 型 的 误 用 。 


10.6.1 ElectricFence K 2v 


ElectricFence ef #4 4: H Bruce Perens 开 发 ， 在 一 些 Linux 发 行 版 如 
RedHat 〈 企 业 版 和 Fedora) 、SUSE 和 openSUSE 中 作为 可 选 组 件 出 现 ， 
EKREN Ete RA DIRE. ERAH Linux hea A Lil OR PRP malloc 
和 free 所 使 用 的 内 存 ， 当 它 发 现 内 存 被 破坏 时 就 停止 程序 的 运行 。 


实 验 ElectricFence 
下 面 这 个 程序 efence.c 调 用 malloc 分 配 了 一 个 内 存 块 ， 然 后 在 这 个 内 
存 块 的 尾部 之 后 写 数 据 。 我 们 来 看 看 将 发 生 什 么 情况 。 


编译 并 运行 这 个 程序 时 ， 我 们 没有 看 到 任何 异常 现象 。 但 是 ， 
malloc 所 分 配 的 内 存 区 域 可 能 已 遭受 一 定 程度 的 破坏 ， 因 此 我 们 迟早 会 
遇 到 麻烦 。 


$ cc -0 efence efence.c 
+ /eftence 


如 果 使 用 同一 个 程序 ， 但 将 它 与 ElectricFence 函 数 库 libefence.a 链 接 
起 来 ， 那 么 在 运行 这 个 程序 时 立刻 就 会 收 到 啊 应 ， 如 下 所 示 : 


ec ~D efence efence.c -lefence 
fefence 


我 们 在 调试 器 下 运行 这 个 程序 以 找 出 问题 所 在 : 


“实验 解析 
ElectricFence 将 malloc 及 其 关联 函数 蔡 换 为 使 用 计算 机 处 理 嚣 虚拟 
内 存 机 制 的 版 本 ， 从 而 保护 系统 不 受 非法 内 存 访问 的 破坏 。 当 出 现 这 类 
的 非法 内 存 访问 时 ， 它 会 引发 一 个 段 冲 突 信 号 并 停止 程序 的 运行 。 


10.6.2 valgrind 

valgrind 是 一 个 工具 ， 它 有 能 力 检测 出 前 面 讨论 过 的 许多 问题 。 特 
别 是 它 可 以 检测 出 数组 访问 错误 和 内 存 泄漏 。 它 可 能 并 没有 包括 在 你 的 
Linux 发 行 版 中 ， 但 可 以 在 http://valgrind.org 上 找到 它 。 


程序 不 需要 重新 编译 就 可 以 使 用 valgrind， 甚 至 还 可 以 用 它 来 调试 
一 个 正在 运行 程序 的 内 存 访问 情况 。 这 个 工具 很 值得 一 试 ， 它 已 被 用 在 
大 型 软件 如 KDE 版 本 3 的 开发 中 。 


实 验 valgrind 

下 面 这 个 程序 checker.c 分 配 了 一 些 内 存 ， 然 后 从 分 配 内 存 以 外 的 区 
域 读 取 数 据 ， 在 分 配 内 存 尾部 之 后 写 数 据 ， 最 后 将 该 内 存 区 域 变 得 不 可 
访问 。 


beyond 


要 想 使 用 valgrind， 只 需 在 运行 valgrind 时 加 上 一 个 选项 告诉 它 我 们 
想 检 查 什 么 ， 然 后 将 要 检查 的 程序 及 其 参数 〈 如 果 有 的 话 ) 写 在 其 后 。 
用 valgrind 运 行程 序 时 ， 我 们 将 看 到 它 诊断 出 许多 问题 ， 如 下 所 
ZN: 


5 valgrind --leak-checkeyes -v ./checker 


==4780== 
ue4780e08 
==4780e28 
==4780-<= 
==4780e2 
==4780== 
224760¢«<« 
--4780-- 
--4780-- 
--4780-- 
--4780-- 
--4780-- 
--6780-- 
--4780-- 


Memcheck, a memory error detector. 

Copyright (C) 2002-2007, and GNU GPL'd, by Julian Seward et al. 
Using LibVEX rev 1732, a library for dynamic binary translation, 
Copyright 【Cj 2004-2007, and GNU GPL'd, by OpenWorks LLP. 

Using valgrind-3.2.3, a dynamic binary instrumentation framework. 
Copyright [C) 2000-2007, and GNU GPL'd, by Julian Seward et al. 


Command line 
. /checker 
Startup, with flags: 
~-leak-checksyes 
-V 
Contents of /proc/version: 
Linux version 2.6.20.2-2-default (geeko@buildhost) lgcc version 4.1.3 


20070218 (prerelease) (SUSE Linux)) #1 SMP Fri Mar 9 21:54:10 UTC 2007 


--$780-- Arch and hweaps: X86, x86-ssel-sse2 

--$780-- Page sizes: currently 4096, max supported 4096 

~-~§780-- Valgrind library directory: /usr/lib/valgrind 

~~4780-- Reading syms from /lib/ld-2.5.so0 (0x4000000) 

--$780-- Reading syms from /home/neil/BLP4e/chapterl0/checker (0x8048000) 
~-4780-- Reading syms from /usr/lib/valgrind/x86-linux/memcheck (0x38000000) 
--4780-- object doesn't have a symbol table 

~-4780-- object deesn't have a dynamic symbol table 

--4780-- Reading suppressions file: /usr/lib/valgrind/default.supp 
--4780-- REDIR: 0x40158B0 (index) redirected to 0x38027EDB (7???) 

~-4780-- Reading syms from /usr/lib/valgrind/x86-lLinux/vgpreload_core.so 
(0x401E000) 

~~4780-- object doesn't have a symbol table 

--$780-- Reading syms from /usr/1lib/valgrind/x86-linux/vgpreload_memcheck.so 
(0x4023000) 

~-46780-- object doesn't have a symbol table 

==4780== WARNING: new redirection conflicts with existing -- ignoring it 

~+4780-- new: 0x040158B0 (index ) R-> 0%04024490 index 

~-4780-- REDIR: Ox4015A50 (strlen) redirected to 0x4024540 (strlen) 

--4780-- Reading syms from /lib/libe-2.5.s0 (0x4043000) 

--4780-- REDIR: Ox40ADFFO (rindex) redirected to 0x4024370 (rindex) 

--4780-- REDIR: 0x40AAF00 (malloc) redirected to 0x4023700 (malloc) 

==4780== Invalid read of size 1 


=.4780ss at 0x804842C: main (checker.c:10) 

=eG7B0e= Address 0x6170428 is 0 bytes after a block of size 1,024 alloc'd 
weSTBOee at 0x4023765: malloc (in /usr/lib/valgrind/x86- 
linux/vgpreload_memcheck.so) 

=24780e= by 0x8068420: main {checker.c:6) 

==4780== 

==4780== Invalid write of size 1 

=24780== at OxBO0d643A: main (checker.c:13) 

=24780<= Address 0x4170428 is 0 bytes after a block of size 1,024 alloc‘d 
-ed BO at 0x4023785: malloc (in /usr/lib/valgrind/x86- 
linux/vgpreload_memcheck. so) 

==4780== by 0x8048420: main [checker.c:6) 

~-4780-- REDIR: Ox40ASBBO (free) redirected to 0x4023312A (free) 
--4780-- REDIR: Ox40AZE70 (memset) redirected to 0x40248A0 (memset) 
==6780== 

=24780== ERROR SUMMARY: 2 errors from 2 contexts (suppressed: 3 from 1) 
2247802 

#24780e2 1 errors in context 1 of 2; 

20678022 Invalid write of size 1 

#087800" at Ox6804643A: main (checker.c:13) 

=<4780e= Address 0x4170428 is 0 bytes after a block of size 1,024 alloc'd 
==4780== at 0x4023785: malloc (in /usr/lib/valgrind/x86- 
linux/vgpreload_mencheck. so) 

=24780== dy 0x8048620: main (checker.c:6) 

==4780== 

226768022 1 errors in context 2 of 2: 

#47800" Invalid read of size 1 

=.4780ss at Ox604662C: main {checker.c:10) 

=.4780:= Address 0x4170428 is 0 bytes after a block of size 1,024 alloc'd 
==4780== at 0x6023785: malloc (in /usr/lib/valgrind/x36- 
linux/vgpreload_memcheck.s0) 

=247802= by 0x8048420: main (checker.c:6) 

~-4780-- 

=-$780-- supp: 3 di-hack3 

=e47B0ee 

==6780== IN SUMMARY: 2 errors from 2 contexts (suppressed: 3 from i} 
==26780== 

#2478022 malloc/free: in use at exit: 1,024 bytes in 1 blocks. 
==4$780== malloc/free: i allocs, 0 frees, 1,024 bytes allocated. 
be 

==6780== searching for pointers to 1 not-freed blocks. 

==4780== checked 65,444 bytes. 

=2¢780== 

=e478008 

==$780== 1,024 bytes in 1 blocks are definitely lost in loss record 1 of 1 
==4780s= at 0x4023785: malloc (in /usr/lib/valgrind/x86- 
linux/vgpreload_memcheck. so) 

=24780e2 by 0x80466620: main (checker.c:6) 

"ed. 

md7BOnm LEAK SUMMARY: 

=24780== definitely lost: 1,024 bytes in 1 blocks. 

Ee possibly lost: 0 bytes in 0 blocks. 

==4780s= still reachable: 0 bytes in 0 blocks. 

=2467802= suppressed; 0 bytes in 0 blocks. 


我 们 看 到 它 查 出 了 错误 的 读 写 操作 ， 同 时 还 给 出 了 与 之 对 应 的 内 存 
块 及 其 分 配 位 置 。 我 们 可 以 用 调试 器 在 错误 地 点 中 断 程 序 的 运行 。 

valgrind 有 许多 选项 ， 包 括 对 特定 类 型 错误 的 抑制 和 内 存 泄 漏 的 检 
测 。 要 想 检 测 程 序 的 内 存 泄漏 问题 ， 我 们 必须 使 用 valgrind 的 一 个 选 
项 。 如 有 果 想 在 程序 运行 结束 时 进行 内 存 泄漏 的 检查 ， 需 要 指定 选项 -- 
leak-check=yes。 我 们 可 以 用 命令 valgrind --help 获 得 完整 的 选项 列表 。 

实验 解析 

我 们 的 程序 在 valgrind 的 控制 下 执行 ， 它 中 途 截 获 程序 执行 的 各 种 
操作 并 进行 许多 检查 工作 ， 包 括 内 存 访问 的 检查 。 如 果 该 访问 操作 涉及 
一 个 已 分 配 的 内 存 块 并 且 是 非法 的 访问 ，valgrind 将 打印 出 消息 。 在 程 
序 执行 结束 时 ， 它 将 运行 一 个 垃圾 收集 例 程 来 检测 是 否 有 已 分 配 的 内 存 
块 未 被 释放 。 如 果 有 ， 它 将 报告 这 些 被 遗弃 的 内 存 块 。 


10.7 小 结 


在 本 章 中 我 们 介绍 了 一 些 调试 工具 和 技巧 。Linux 提 供 了 一 些 功能 
强大 的 工具 帮助 我 们 修复 程序 中 的 漏洞 。 我 们 用 gdb 消 除了 示例 程序 中 
的 漏洞 ， 并 介绍 了 一 些 静 态 分 析 工 具 ， 如 cflow 和 splint。 最 后 ， 我 们 对 
使 用 动态 内 存 分 配 可 能 出 现 的 问题 进行 了 讨论 ， 并 介绍 了 一 些 可 以 帮助 
我 们 诊断 它们 的 工具 ， 如 ElectricFence 和 valgrind. 

在 本 章 中 讨论 的 大 多 数 工 具 都 可 以 在 因特网 上 的 FIP 服务 器 中 找 
到 。 我 们 关心 的 是 在 某 些 情况 下 需要 注意 保留 版 权 信 息 。 其 中 许多 工具 
的 信息 都 取 自 Linux 档 案 网 站 http://www.ibiblio.org/pub/Linux. 我 们 希望 最 
新 发 布 的 版 本 也 可 以 在 该 网 址 找到 。 


Fok a O 一 人 
11 We 


进程 和 信号 构成 了 Linux 操 作 环境 的 基础 部 分 。 它 们 控制 着 Linux 
和 所 有 其 他 类 UNIX 计 算 机 系统 执行 的 几乎 所 有 活动 。 不 管 是 对 于 系统 
程序 员 、 应 用 程序 员 还 是 系统 管理 者 ， 理 解 Linux 和 UNIX 系 统 的 进程 管 
理 都 是 很 有 好 处 的 。 

在 本 章 中 ， 我 们 将 看 到 Linux 环 境 中 的 进程 是 如 何 被 管理 的 ， 怎 样 
才能 知道 计算 机 在 任 一 给 定时 刻 在 做 些 什么 。 我 们 还 将 介绍 如 休 才 能 在 
自己 的 程序 中 启动 和 停止 其 他 的 进程 ， 如 何 让 进程 收发 消息 ， 如 何 避 免 
便 户 进程 等 内 容 。 具 体 地 ， 我 们 将 介绍 以 下 帮 方 面 的 内 容 ; 

号” 进程 的 结构 、 类 型 和 调度 

口 用 不 同 的 方法 启动 新 进程 

D I TRAEN ITE 

D IEA mia E R TEEN 


11.1 Z Fe THRE 


UNIX 标 准 (特别 是 IEEE Std 1003. 1,2004 年 版 ) 把 进程 定义 
为 : “一 个 其 中 运行 着 一 个 或 多 个 线程 的 地 址 空间 和 这 些 线程 所 需要 的 
系统 资源 。” 我 们 将 在 第 12 章 介绍 线程 。 目 前 ， 可 以 把 进程 看 作 正 在 运 
行 的 程序 。 

像 Linux 这 样 的 多 任务 操作 系统 可 以 同时 运行 多 个 程序 。 每 个 运行 
着 的 程序 实例 就 构成 一 个 进程 。 在 X 视 窗 系统 (通常 简称 为 XxX) 等 视窗 
化 系统 中 这 一 特点 尤为 明显 。 如 同 微 软 的 Windows 系 统 ，X 视 窗 系 统 提 
供 了 一 个 图 形 化 的 用 户 界 面 ， 它 允许 同时 运行 多 个 应 用 程序 ， 每 个 应 用 
程序 可 以 在 一 个 或 多 个 窗口 中 显示 。 

作为 多 用 户 系统 ，Linux 人 允许 许多 用 户 同 时 访问 系统 。 每 个 用 户 可 
以 同时 运行 许多 个 程序 ， 甚 至 同时 运行 同一 个 程序 的 许多 个 实例 。 系 统 
本 身 也 运行 着 一 些 管理 系统 资源 和 控制 用 户 访问 的 程序 。 

正如 我 们 在 第 4 章 看 到 的 ， 正 在 运行 的 程序 或 进程 由 程序 代码 、 数 
据 、 变 量 〈 占 用 着 系统 内 存 ) 、 打 开 的 文件 《文件 摘 述 符 ) 和 环境 组 
成 。 一 般 来 说 ，Linux 系 统 会 在 进程 之 间 共 享 程 序 代 码 和 系统 函数 库 ， 
所 以 在 任何 时 刻 内 存 中 都 只 有 代码 的 一 份 副本 。 


11.2 进程 的 结构 


我 们 来 看 看 操作 系统 是 如 何 管理 多 个 进程 的 。 如 果 有 两 个 用 户 neil 
和 rick， 他 们 同时 运行 grep 程 序 在 不 同 的 文件 中 查找 不 同 的 字符 串 。 他 
们 使 用 的 进程 如 图 11-1 所 示 。 


neil rick 
$ grep kirk trek.txt $ grep troi nextgen.doc 
PID 101 PID 102 
代码 串 grep 程 序 代码 一 | ”代码 
n L — ——— oo) 
数据 数据 
s = "kirk" S= "iroi" | 
> CHR AMF K 函数 库 
| 文件 | 
ý v 
trek. txt nextgen.doc 


图 11-1 


如 果 在 搜索 结束 之 前 运行 ps 命令 ， 则 该 命令 输出 类 似 下 面 这 样 的 内 


ZJN 


ot 


$ ps -ef 


每 个 进程 都 会 被 分 配 一 个 唯一 的 数字 编号 ， 我 们 称 之 为 进程 标识 符 
或 PID. 它 通常 是 一 个 取 值 范围 从 2 到 32768 的 正 整数 。 当 进程 被 启动 时 ， 
系统 将 按 顺 序 选择 下 一 个 未 被 使 用 的 数字 作为 它 的 PID, 当 数字 已 经 回 绕 
一 圈 时 ， 新 的 PID 重 新 从 2 开始 。 数 字 1 一 般 是 为 特殊 进程 init 保 留 的 ， 
init 进 程 负 责 管理 其 他 进程 ， 我 们 很 快 就 会 再 次 谈 到 它 。 这 里 我 们 可 以 
看 到 由 用 户 neil 和 rick 局 动 的 两 个 进程 被 分 配 的 PID 分 别 是 101 和 102。 

将 要 被 grep 命 令 执行 的 程序 代码 被 保存 在 一 个 磁盘 文件 中 。 正 常情 
况 下 ，Linux 进 程 不 能 对 用 来 存放 程序 代码 的 内 存 区 域 进行 写 操作 ， 即 
程序 代码 是 以 只 读 方 式 加 载 到 内 存 中 的 。 我 们 从 图 11-1 中 可 以 看 到 ， 虽 
然 不 能 对 这 个 区 域 执 行 写 操作 ， 但 它 可 以 被 多 个 进程 安全 地 共享 。 


系统 函数 库 也 可 以 被 共享 。 例 如 ， 不 管 有 多 少 个 正在 运行 的 程序 要 
调用 printf 函 数 ， 内 存 中 只 要 有 它 的 一 份 副 本 即 可 。 这 种 做 法 与 微软 
Windows 操 作 系统 中 使 用 的 动态 链接 库 (DLL) 机制 类 似 ， 但 更 加 复 


杂 。 

从 上 图 中 还 可 以 看 出 ， 共 享 函数 库 带 来 的 男 一 个 优点 是 ， 包 含 可 执 
行程 序 grep 的 磁盘 文件 容量 比较 小 ， 因 为 它 不 包含 共享 函数 库 人 代码。 这 
对 一 个 单独 的 程序 来 说 ， 算 不 上 大 优点 ， 但 对 整个 操作 系统 来 说 ， 把 常 
OU DN GET Ciera EN ME RBS E ee Ha 
可 空间 。 

当然 ， 并 不 是 程序 在 运行 时 所 需要 的 所 有 东西 都 可 以 被 共享 。 例 
如 ， 进 程 使 用 的 变量 就 与 其 他 进程 所 使 用 的 截然 不 同 。 在 本 例 中 ， 传 递 
给 grep 程 序 的 搜索 字符 串 以 变量 s 的 形式 出 现在 每 个 进程 的 数据 区 中 。 它 
们 之 间 是 分 离 的 ， 通 常 不 能 被 其 他 进程 读 取 。 这 两 个 grep 命 令 所 使 用 的 
文件 也 各 不 相同 ， 进 程 通 过 各 上 自 的 文件 摘 述 符 来 访问 文件 。 

除 此 之 外 ， 进 程 有 目 己 的 栈 空间 ， 用 于 保存 函数 中 的 局 部 变量 和 控 
制 函 数 的 调用 与 返回 。 进 程 还 有 目 己 的 环境 空间 ， 包 含 专门 为 这 个 进程 
建立 的 环境 变量 ， 我 们 在 第 4 章 介 绍 putenv 和 getenv 函 数 时 已 用 过 这 些 环 
境 变 量 。 进 程 还 必须 维护 自己 的 程序 计数 器 ， 这 个 计数 器 用 来 记录 它 执 
行 到 的 位 置 ， 即 在 执行 线程 中 的 位 置 。 我 们 将 在 下 一 章 看 到 ， 在 使 用 线 
程 时 ， 进 程 可 以 有 不 止 一 个 执行 线程 。 

在 许多 Linux 系 统 〈 也 包括 一 些 UNIX 系 统 ) 上 ， 在 目录 /proc 中 有 一 
组 特殊 的 文件 ， 这 些 文件 的 特殊 之 处 在 于 它们 人 允许 你 “ 堪 视 ?正在 运行 的 
进程 的 内 部 情况 ， 就 好 像 这 些 进程 是 目录 中 的 文件 一 样 。 我 们 在 第 3 章 
已 简单 介绍 过 /proc 文 件 系统 了 。 

最 后 ， 因 为 Linuxz 和 UNIX 一 样 ， 有 一 个 虚拟 内 存 系统 ， 能 够 把 程序 
代码 和 数据 以 内 存 页 面 的 形式 放 到 硬盘 的 一 个 区 域 中 ， 所 以 Linux 可 以 
管理 的 进程 比 物理 内 存 所 能 容纳 的 要 多 得 多 。 


11.2.1 HER 


Linux 进 程 表 就 像 一 个 数据 结构 ， 它 把 当前 加 载 在 内 存 中 的 所 有 进 
程 的 有 关 信 息 保存 在 一 个 表 中 ， 其 中 包括 进程 的 PID、 进 程 的 状态 、 命 
令 字 符 串 和 其 他 一 些 ps 命令 输出 的 各 类 信息 。 操 作 系 统 通 过 进程 的 PID 
对 它们 进行 管理 ， 这 些 PID 是 进程 表 的 索引 。 进 程 表 的 长 度 是 有 限制 
的 ， 所 以 系统 能 够 文 持 的 同时 运行 的 进程 数 也 是 有 限制 的 。 早 期 的 
UNIX 系 统 只 能 同时 运行 256 个 进程 。 最 新 的 实现 版 本 已 大 幅度 放宽 这 一 
限制 ， 可 以 同时 运行 的 进程 数 可 能 只 与 用 于 建立 进程 表 项 的 内 存 容量 有 


天， 而 没有 具体 的 数字 限制 了 。 
11.2.2 ”查看 进程 


ps 命令 可 以 显示 我 们 正在 运行 的 进程 、 其 他 用 户 正 在 运行 的 进程 或 
者 目前 在 系统 上 运行 的 所 有 进程 。 下 面 是 ps 命令 的 输出 样本 : 


5S ps -ef 


这 个 命令 显示 了 许多 进程 的 相关 信息 ， 包 括 在 X 视 窗 系统 中 运行 的 
Emacs 编辑 器 。 例 如 ，TTY 一 列 显 示 了 进程 是 从 哪 一 个 终端 局 动 的 ， 
TIME 一 列 是 进程 目前 为 止 所 占用 的 CPU 时 间 ，CMD 一 列 显示 启动 进程 
所 使 用 的 命令 。 下 面 我 们 来 仔细 查看 其 中 的 一 些 进程 信息 。 

neil 655 428 0 18:24 tty4 00:00:00 -bash 

用 户 的 初始 登录 是 在 第 4 个 虚拟 终端 完成 的 。 该 终端 是 这 台 机 器 的 
一 个 主 控 台 。 运 行 的 shell 程 序 是 Linux 系 统 的 默认 shell: bash. 

root 467 433 0 18:12 ttyl 00:00:00 sh /usr/XIIR6/bin/startx 

X 视 窗 系 统 是 由 命令 startx 有 启动 的 。 该 命令 是 一 个 shell 脚 本 ， 它 启动 
X 服 务 器 并 运行 一 些 初始 化 X 视 窗 系 统 的 程序 。 

root 717 716 13 18:28 pts/0 00:00:01 emacs 

这 个 进程 代表 看 X 视 窗 系 统 中 一 个 运行 着 Emacs 编辑 器 的 窗口 。 它 
是 由 窗口 管理 器 啊 应 一 个 创建 新 窗口 的 请 求 而 启动 的 。 系 统 还 分 配给 
shel 一 个 新 的 伪 终 端 pts/0,shell 可 以 通过 该 终端 进行 读 写 操作 。 

root 512 1 0 18:12 ttyl 00:00:01 gnome-help-browser --sm-client-i 

这 是 由 窗口 管理 器 局 动 的 GNOME 帮 助 信息 浏览 器。 

默认 情况 下 ，ps 程 序 只 显示 与 终端 、 主 控 台 、 串 行 口 或 伪 终 端 保 持 
连接 的 进程 的 信息 。 其 他 进程 在 运行 时 不 需要 通过 终端 与 用 户 进行 通 
信 ， 它 们 通常 都 是 一 些 系统 进程 ，Linux 用 它们 来 管理 共享 的 资源 。 我 


们 可 以 用 ps 命令 的 -a 选项 全 看 所 有 的 进程 ， 用 -选项 显示 进程 宛 到 的 信 


ps 命令 的 精确 语法 及 其 输出 内 容 的 格式 随 系 统 的 不 同 而 稍 有 变 
化 。Linux 使 用 的 GNU 版 本 的 ps 命令 支持 来 自 以 前 几 个 ps 命令 实现 
版 本 中 的 选项 (包括 来 自 UNIX 变 体 BSD 和 AT&T 中 ps 命令 的 选 
项 ) ， 并 且 它 还 新 增 了 一 些 选项 。 有 关 ps 命 令 可 使 用 的 选项 和 输出 
格式 的 更 多 细节 请 参考 其 手册 。 


11.2.3 统 进 程 


下 面 显示 的 是 运行 在 另 一 台 Linux 系 统 上 的 一 些 进程 。 为 清楚 起 
见 ， 我 们 对 输出 结果 进行 了 简化 。 在 下 面 的 例子 中 ， 你 将 看 到 如 何 碍 看 
进程 的 状态 。ps 命 令 输 出 中 的 STAT 一 列 用 来 表明 进程 的 当前 状态 。 常 
见 的 STAT 代 码 见 表 11-1。 其 中 一 些 代 码 的 含义 将 随 着 本 章 后 面 的 介绍 
fe ee ee 
忽略 它们 。 


表 11-1 


STAT 代 码 


不 可 中 斯 的 胜 瑟 〈 等 待 )， 通常 是 在 等 待 输入 臣 输 出 完成 

停止 。 通常 是 被 shell 作 业 控 制 所 停止 ， 或 者 进程 正 处 于 调试 器 的 控制 之 下 
W (Defunct) EA zombie) BEA 

ERRERA. nice 


getty tty3 


23- i Sr/lib/beagle/ IndexHelper. exe 
qmgr =l t fife u 


pickup -1 -t fife 


我 们 在 这 里 看 到 了 一 个 非常 重要 的 进程 。 

1? Ss 0:03 init [5] 

一 般 而 言 ， 每 个 进程 都 是 由 男 一 个 我 们 称 之 为 父 进 程 的 进程 局 动 
的 ， 被 父 进程 启动 的 进程 叫做 子 进程 。Linux 系 统 局 动 时 ， 它 将 运行 一 
个 名 为 init 的 进程 ， 该 进程 是 系统 运行 的 第 一 个 进程 ， 它 的 进程 号 为 1。 
你 可 以 把 init 进 程 看 作为 操作 系统 的 进程 管理 费 ， 它 是 其 他 所 有 进程 的 
祖先 进程 。 我 们 将 要 看 到 的 其 他 系统 进程 要 么 是 由 init 进 程 启动 的 ， 要 
么 是 由 被 init 进 程 局 动 的 其 他 进程 局 动 的 。 

用 户 登录 的 处 理 过 程 就 是 一 个 这 样 的 例子 。init 进 程 为 每 个 用 户 用 
来 登录 的 串 行 终端 或 拨号 调制 解 调 器 月 动 一 次 getty 程 序 。 对 应 的 ps 命令 
输出 如 下 所 示 : 

9619 tty2 Ss+ 0:00 /sbin/mingetty tty2 

getty RES AP OK A Aim BRE, TRIAD aN AS RTE AN TT 28 
后 把 控制 移交 给 登录 程序 ， 登 录 程序 设置 用 户 环 境 ， 最 后 局 动 一 个 
shell。 用 户 退 出 系统 时 ，init 进 程 将 再 次 启动 男 一 个 getty 进 程 。 


启动 新 进程 并 等 待 它们 结束 的 能 力 是 整个 系统 的 基础 。 我 们 将 在 本 
se ala 己 的 程序 中 用 系统 调用 fork、exec 和 wait 来 完成 
同样 的 任务 。 


11.2.4 进程 调度 


ps 命令 的 输出 结果 中 还 有 一 条 对 应 ps 命令 本 里 的 记录 : 

21475 pts/2 R+ 0:00 ps ax 

这 行 表 明 进 程 21475 处 于 运行 状态 (R)〉， 正 在 执行 的 命令 是 ps 
ax。 也 就 是 说 ， 这 个 进程 出 现在 自己 的 输出 结果 中 了 。 这 个 状态 指示 符 
只 表示 程序 已 准备 好 运行 ， 并 不 意味 着 它 正 在 运行 。 在 一 台 单 处 理 右 计 
算 机 上 ， 同 一 时 间 只 能 有 一 个 进程 可 以 运行 ， 其 他 进程 处 于 等 待 运行 状 
态 。 每 个 进程 轮 到 的 运行 时 间 (我 们 称 之 为 时 间 片 是 相当 短暂 的 ， 这 
就 给 人 一 种 多 个 程序 在 同时 运行 的 假象 。 状 态 R+ 只 表示 这 个 程序 是 一 
个 前 台 任 务 ， 它 不 是 在 等 待 其 他 进程 结束 或 等 竺 输入 输出 操作 完成 。 这 
就 是 为 什么 你 可 能 会 在 ps 命令 的 输出 结果 中 看 到 两 个 这 样 的 进程 的 原因 
( 男 一 个 常见 的 标记 为 正在 运行 的 进程 是 X 显 示 服 务 器 〉。 

Linux 内 核 用 进程 调度 器 来 决定 下 一 个 时 间 片 应 该 分 配给 哪个 进 
程 。 它 的 判断 依据 是 进程 的 优先 级 (我 们 在 第 4 章 已 讨论 过 优先 级 的 概 
念 ) 。 优 先 级 高 的 进程 运行 得 更 为 频繁 。 而 其 他 进程 ， 如 低 优 先 级 的 后 
台 任 务 运行 的 就 不 是 非常 频繁 。 在 Linux 中 ， 进 程 的 运行 时 间 不 可 能 超 
过 分 配给 它们 的 时 间 片 ， 它 们 采用 的 是 抢先 式 多 任务 处 理 ， 所 以 进程 的 
挂 起 和 继续 运行 无 需 彼 此 之 间 的 协作 。 但 早 一 些 的 系统 ， 如 微软 的 
Windows 3.x， 通常 需要 进程 明确 地 退出 时 间 片 ， 然 后 其 他 进程 才能 继 
续 运 行 。 

在 一 个 如 Linux 这 样 的 多 任务 系统 中 ， 多 个 程序 可 能 会 苋 争 使 用 同 
一 个 资源 。 在 这 种 情况 下 ， 执 行 短 期 的 突 发 性 工作 并 暂停 运行 来 等 待 输 
入 的 程序 ， 要 比 持 续 占 用 处 理 吉 来 进行 计算 或 不 断 轮 询 系统 来 查看 是 否 
有 新 的 输入 到 达 的 程序 要 更 好 。 我 们 称 表现 良好 的 程序 为 nice 程 序 ， 而 
且 在 某 种 意义 上 ， 这 个 nice 是 可 以 被 计算 出 来 的 。 操 作 系 统 根据 进程 的 
nice 值 来 决定 它 的 优先 级 ， 一 个 进程 的 nice 值 默认 为 0 并 将 根据 这 个 程序 
的 表现 而 不 断 变 化 。 长 期 不 间断 运行 的 程序 的 优先 级 一 般 会 比较 低 。 而 
(例如 ) 暂停 来 等 待 输入 的 程序 会 得 到 奖励 。 这 可 以 帮助 与 用 户 进行 交 
互 的 程序 保持 及 时 的 啊 应 性 。 在 程序 等 竺 用 户 的 输入 时 ， 系 统 会 增加 它 
的 优先 级 ， 这 样 ， 当 它 准 备 继续 运行 时 ， 它 就 会 有 比较 高 的 优先 级 而 能 
优先 执行 。 我 们 可 以 用 nice 命 令 设置 进程 的 nice 值 ， 使 用 renice 命 令 调整 
它 的 值 。nice 命 令 是 将 进程 的 nice 值 增加 10， 从 而 降低 该 进程 的 优先 


级 。 我 们 可 以 用 ps 命令 的 -1 或 -f (长 格式 输出 〉 选 项 查看 正在 运行 的 进 
程 的 nice 值 。 我 们 感 兴趣 的 值 列 在 NI (nice) 一 栏 ， 如 下 所 示 : 


$ ps -1 


我 们 看 到 oclock 程 序 〈 进 程 号 为 1362) 正在 以 默认 的 nice 值 运行 。 
如 有 果 我 们 用 下 面 的 命令 来 启动 它 : 

$nice oclock & 
它 将 分 配 到 一 个 +10 的 nice 值 。 如 果 用 下 面 的 命令 调整 这 个 值 : 

$renice 10 1362 

1362: old priority 0, new priority 10 
这 个 时 钟 程序 运行 得 就 会 不 那么 频繁 了 。 我 们 可 以 再 用 ps 命令 查看 修改 
过 的 nice 值 ， 如 下 所 示 : 


$ ps -1 


状态 栏 STAT 中 包含 字符 N 表 明 这 个 进程 的 nice 值 已 被 修改 过 ， 已 经 
不 是 默认 值 了 。 


ps 命令 输出 中 的 PPID 栏 给 出 的 是 父 进程 的 进程 ID， 它 是 局 动 这 个 进 
程 的 进程 的 PID. 如 果 原 来 的 父 进程 已 经 不 存在 ， 该 栏 显 示 的 就 是 init 进 程 
的 进程 ID (PID 为 1) . 

Linux 调 上 度 占 根据 进程 的 优先 级 来 决定 运行 哪个 进程 。 每 个 系统 的 
有 具体 实现 各 有 不 同 ， 但 高 优先 级 的 进程 总 是 运行 得 更 频 索 。 某 些 情况 
下 ， 只 要 还 有 高 优先 级 的 进程 可 以 运行 ， 低 优先 级 的 进程 束 根 本 不 能 运 


行 。 


11.3 ZIT It 


我 们 可 以 在 一 个 程序 的 内 部 启动 男 一 个 程序 ， 从 而 创建 一 个 新 进 
程 。 这 个 工作 可 以 通过 库 函 数 system 来 完成 。 


int system (const char *string); 
system 函 数 的 作用 是 ， 运 行 以 字符 串 参 数 的 形式 传递 给 它 的 命令 并 
等 待 该 命令 的 完成 。 命 令 的 执行 情况 就 如 同 在 shell 中 执行 如 下 的 命令 : 
$sh -c string 
如 果 无 法 局 动 shell 来 运行 这 个 命令 ，system 冰 数 将 返回 错误 代码 127; 如 
果 是 其 他 错误 ， 则 返回 -1。 和 否则 ，system 函 数 将 返回 该 命令 的 退出 码 。 


S 验 systeme žr 

我 们 用 system 函 数 来 编写 一 个 程序 ， 让 它 蔡 我 们 运行 ps 命令 。 虽 然 
这 个 程序 本 身 的 用 处 不 是 很 大 ， 但 我 们 将 在 后 面 的 例子 中 对 这 一 技术 做 
进一步 开发 。 为 了 人 简单， 我 们 在 这 个 例子 中 也 没有 检查 system 调 用 是 否 
能 够 真正 的 工作 。 


finclude <stdlib.h> 


编译 并 运行 这 个 程序 system1.c 时 ， 将 看 到 如 下 所 示 的 输出 : 


SLANT 
MMANT 


因为 system 函 数 用 一 个 shell 来 启动 想 要 执行 的 程序 ， 所 以 可 以 把 这 
个 各 序 让 后 台 执 各。 具体 人 法 是 将 sysieml.c 沾 的 了 数 调 用 修 故 为 而 
这 样 


$ ./system2 


465 pots 


在 第 一 个 例子 中 ， 程 序 以 字符 串 “ps _ ax” 为 参数 调用 System 函数 从 而 
在 程序 中 执行 ps 命令 。 我 们 的 程序 在 ps 命令 完成 后 从 system 调 用 中 返 
回 。system 函 数 很 有 用 ， 但 它 也 有 局 限 性 ， 因 为 程序 必须 等 待 由 system 
函数 局 动 的 进程 结束 之 后 才能 继续 ， 因 此 我 们 不 能 立刻 执行 其 他 任务 。 

在 第 二 个 例子 中 ， 对 system 冰 数 的 调用 将 在 shell 命 令 结束 后 立刻 返 
回 。 由 于 它 是 一 个 在 后 台 运 行程 序 的 请 求 ， 所 以 ps 程序 一 启动 shell 束 返 
回 了 ， 这 与 我 们 在 shell 提 示 符 下 执行 下 面 这 条 命令 的 效果 是 一 样 的 。 

$ps ax& 

在 ps 命令 还 未 来 得 及 打印 出 它 的 所 有 输出 结果 之 前 ，system2 程 序 就 
打印 出 字符 串 Done 然 后 退出 了 。 在 system2 程 序 退 出 后 ，ps 命 令 继 续 完 
成 它 的 输出 。 这 类 的 处 理 行为 往往 会 给 用 户 带 来 很 大 的 困惑 。 如 果 想 要 
用 好 进程 ， 我 们 就 需要 能 够 对 它们 的 行为 做 更 细致 的 控制 。 下 面 米 看 一 
个 用 来 创建 进程 的 底层 接口 exec. 


一 般 来 说 ， 使 用 system 函 数 远 非 局 动 。 其 他 进程 的 理想 手段 ， 
因为 它 必 须 用 一 个 shell 来 启动 需要 的 程序 。 由 于 在 启动 程序 之 前 需 
要 先 启动 一 个 shell， 而 且 对 shell 的 安装 情况 及 使 用 的 环境 的 依赖 也 
很 大 ， 所 以 使 用 system 函 数 的 效率 不 高 。 在 下 一 节 中 ， 我 们 将 看 到 
一 种 更 好 的 调用 程序 的 方法 ， 与 system 调 用 相 比 ， 我 们 应 该 总 是 在 
程序 中 优先 使 用 这 种 方法 。 


1. 蔡 换 进程 映像 


exec 系 列 函 数 由 一 组 相关 的 函数 组 成 ， 它 们 在 进程 的 启动 方式 和 程 
序 参 数 的 表达 方式 上 各 有 不 同 。exec 函 数 可 以 把 当前 进程 蔡 换 为 一 个 新 
进程 ， 新 进程 由 path 或 fle 参 数 指定 。 你 可 以 使 用 exec 函 数 将 程序 的 执行 
从 一 个 程序 切换 到 另 一 个 程序 。 例 如 ， 你 可 以 在 局 动 另 一 个 有 着 受 限 使 
用 策略 的 程序 前 ， 检 查 用 户 的 凭证 。exec 函 数 比 system 函 数 更 有 效 ， 


AER NEE a Sa, JORMA AFIS T o 


#include <unistd.h> 


char **environ; 


int execl(const char *path, const char *arg0, ..., (char *)0); 

int execlp(const char *file, const char *arg0, ..., (char *)0); 

int execle(const char *path, const char *arg0, ..., (char *)0, char *const 
envp[]); 


int execv(const char *path, char *const argv[])}); 
int execvp(const char *file, char *const argv[)}); 
int execve(const char *path, char *const argv[], char *const envp[)); 


这 些 函 数 可 以 分 为 两 大 类 。execl、execlp 和 execle 的 参数 个 数 是 可 
变 的 ， 参 数 以 一 个 空 指 针 结 束 。execv 和 execvp 的 第 二 个 参数 是 一 个 字符 
串 数 组 。 不 管 是 哪 种 情况 ， 新 程序 在 启动 时 会 把 在 argv 数 组 中 给 定 的 参 
数 传 递 给 main 函 数 。 

这 些 函数 通常 都 是 用 execve 实 现 的 ， 虽 然 并 不 是 必须 要 这 样 做 。 

以 字母 p 结 尾 的 函数 通过 搜索 PATH 环境 变量 来 查找 新 程序 的 可 执行 
文件 的 路 径 。 如 果 可 执行 文件 不 在 PATH 定义 的 路 径 中 ， 我 们 就 需要 把 
包括 目录 在 内 的 使 用 绝对 路 径 的 文件 名 作为 参数 传递 给 函数 。 

全 局 变量 environ 可 用 来 把 一 个 值 传递 到 新 的 程序 环境 中 。 此 外 ， 函 
数 execle 和 execve 可 以 通过 参数 envp 传 递 字符 串 数组 作为 新 程序 的 环境 
变量 。 

如 果 想 通过 exec 函 数 来 启动 ps 程序 ， 我 们 可 以 从 6 个 exec 函 数 中 选择 
一 个 ， 如 下 面 的 代码 片段 所 示 : 


实 验 execlp 函 数 
修改 示例 程序 ， 使 用 execlp 函 数 调用 : 


运行 这 个 程序 时 ， 你 会 看 到 正常 的 ps 输出 ， 但 字符 串 Done 却 根本 没 
有 出 现 。 男 外 值得 注意 的 是 ， ps 的 输出 中 没有 pexec 进 程 的 任何 信息 。 


实验 解析 

程序 先 打 印 出 它 的 第 一 条 消息 ， 接 着 调用 execlp， 这 个 函数 在 
PATH 环境 变量 给 出 的 目录 中 搜索 程序 ps。 然 后 用 这 个 程序 替换 pexec 程 
序 ， 就 好 像 直接 使 用 如 下 所 示 的 shell 命 令 一 样 : 

$ps ax 

ps 命令 结束 时 ， 我 们 看 到 一 个 新 的 shell 提 未 符 ， 因为 我 们 并 没有 再 
返回 到 pexec 程 序 中 ， 所 以 第 二 条 消息 是 不 会 打印 出 来 的 。 新 进程 的 
PID、 PPID 和 mice 值 与 原先 的 完全 一 样 。 事实 上 ， 这 里 发 生 的 一 切 其 实 
es 运行 中 的 程序 开始 执行 exec 调 用 中 指定 的 新 的 可 执行 文件 中 的 代 


”对 于 由 exec 函 数 启动 的 进程 来 说 ， 它 的 参数 表 和 环境 加 在 一 起 的 总 
a 是 有 限制 的 。 上 限 由 ARG_MAX 给 出 ， 在 Linux 系 统 上 它 是 128K 字 

。 其 他 系统 可 能 会 设置 一 个 非常 有 限 的 长 度 ， 这 有 可 能 会 导致 出 现 问 
题 ， POSIX 规 范 要 求 ARG_ ee 4096 个 字 节 。 

一 般 情 况 下 ，exec 函 数 是 不 会 返回 的 ， 除 非 发 生 了 错误 。 出 现 错误 
时 ，exec 函 数 将 返回 -1， 并 且 会 设置 错误 变量 errno. 

由 exec 启 动 的 新 进程 继承 了 原 进程 的 许多 特性 。 特 别 地 ， 在 原 进程 
中 已 打开 的 文件 描述 符 在 新 进程 中 仍 将 保持 打开 ， 除 非 它 们 的 “执行 时 
关闭 标志 ”(close on exec flag) 被 置 位 《详细 说 明 请 参考 第 3 章 中 对 
o 的 介绍 ) 。 任 何在 原 进 程 中 已 打开 的 目录 流 都 将 在 新 进程 

被 关闭 


2. 复 制 进程 映像 


要 想 让 进程 同时 执行 多 个 函数 ， 我 们 可 以 使 用 线程 〈 将 在 第 12 章 介 
绍 ) 或 从 原 程序 中 创建 一 个 完全 分 离 的 进程 ， 后 者 束 像 init 的 做 法 一 
样 ， 而 不 像 exec 调 用 那样 用 新 程序 丛 换 当前 执行 的 线程 。 

我 们 可 以 通过 调用 fork 创 建 一 个 新 进程 。 这 个 系统 调用 复制 当前 进 
程 ， 在 进程 表 中 创建 一 个 新 的 表 项 ， 新 表 项 中 的 许多 属性 与 当前 进程 是 
相同 的 。 新 进程 几乎 与 原 进程 一 模 一 样 ， 执 行 的 代码 也 完全 相同 ， 但 新 
进程 有 自己 的 数据 空间 、 环 境 和 文件 插 述 符 。fork 和 exec 函 数 结合 在 一 
起 使 用 就 是 创建 新 进程 所 需要 的 一 切 了 。 


#include <sys/types.h> 
#include <unistd.h> 


pid t fork(void); 


最 初 的 进程 


| 
| 
| 
f 


返回 一 个 新 的 PID 返回 0 


图 11-2 


图 11-2 


如 图 11-2 所 示 ， 在 父 进 程 中 的 fork 调 用 返回 的 是 新 的 子 进程 的 PID。 
新 进程 将 继续 执行 ， 就 像 原 进程 一 样 ， 不 同 之 处 在 于 ， 子 进程 中 的 fork 
父子 进程 可 以 通过 这 一 点 来 判断 完 竟 谁 是 父 进程 ， 谁 
KE Eo 

如 果 fork 失 败 ， 它 将 返回 -1。 失 败 通常 是 因为 父 进程 所 拥有 的 子 进 
程 数 目 超过 了 规定 的 限制 (CHILD_MAX) ， 此 时 ermo 将 被 设 为 
EAGAIN。 如 果 是 因为 进程 表 里 没 有 足够 的 空间 用 于 创建 新 的 表单 或 虚 
拟 内 存 不 足 ，errno 变 量 将 被 设 为 ENOMEM. 

一 个 典型 的 使 用 fork 的 代码 片段 如 下 所 示 : 


X 验 fork 函 数 
我 们 来 看 一 个 简单 的 例子 forkl.c: 


Sinclude <unistd.h> 


exitid); 


这 个 程序 以 两 个 进程 的 形式 在 运行 。 子 进程 被 创建 并 且 输 出 消息 5 
次 。 原 进程 〈《 即 父 进程 ) 只 输出 消息 3 次 。 父 进程 在 子 进程 打印 完 它 的 
恩 之 前 就 结束 了 ， 因 此 我 们 将 看 到 在 输出 内 容 中 混杂 着 一 个 shell 
是 示 符 。 


$ ./forkl 


实验 解析 

程序 在 调用 fork 时 被 分 为 两 个 独立 的 进程 。 程 序 通过 fork 调 用 返回 
的 非 零 值 确定 父 进 程 ， 并 根据 该 值 来 设置 消息 的 输出 次 数 ， 两 次 消息 的 
输出 之 间 间隔 一 秒 。 


11.3.1 等待 一 个 进程 


当 用 fork 局 动 一 个 子 进程 时 ， 子 进程 就 有 了 它 自 己 的 生命 周期 并 将 
独立 运行 。 有 时 ， 我 们 希望 知道 一 个 子 进程 何 时 结束 。 例 如 ， 在 前 面 的 
示例 程序 中 ， 父 进程 在 子 进程 之 前 结束 ， 由 于 子 进程 还 在 继续 运行 ， 所 
以 得 到 的 输出 结果 有 点 乱 。 我 们 可 以 通过 在 父 进 程 中 调用 wait 函 数 让 父 
进程 等 待 子 进程 的 结束 。 


#include <sys/types.h> 
#include <sys/wait.h> 


pid_t wait(int *stat_loc); 


wait 系 统 调用 将 暂停 父 进程 直到 它 的 子 进程 结束 为 止 。 这 个 调用 返 
回 子 进程 的 PID， 它 通常 是 已 经 结束 运行 的 子 进程 的 PID. 状 态 信 息 允 许 
父 进程 了 解 子 进程 的 退出 状态 ， 即 子 进程 的 main 函 数 返回 的 值 或 子 进程 
中 exit 函 数 的 退出 码 。 如 果 stat_loc 不 是 空 指针 ， 状 态 信息 将 被 写 入 它 所 
指向 的 位 置 。 
”我们 可 以 用 sys/waith 文 件 中 定义 的 宏 来 解释 状态 信息 ， 如 表 11-2 所 
示 。 


表 11-20 


X 验 wait 函 数 
我 们 稍微 修改 一 下 程序 ， 让 父 进程 等 待 并 检查 子 进程 的 退出 状态 。 
新 sa ie van c: 


i Do 部 分 等 待 子 进 程 完成 : 


ut stat 
pid_t ct d 
Lid pi a “ub 
printf(*Child has finished: PID td\n*, child pid); 
if (WIFEXITED(stat_va 
rintf(*Child exited with code td\n", WEXITSTATUS(stat_val)); 


£(*Child terminated abnormally\n"); 


te F 
c ae ; 


运行 这 个 程序 时 ， 我 们 将 看 到 父 进程 等 待 子 进 程 的 情况 


$ ./wait 


实验 解析 

父 进程 〈 从 fork 调 用 中 获得 一 个 非 零 的 返回 值 ) 用 wait 系 统 调用 将 
目 己 的 执行 挂 起 ， 直 到 子 进程 的 状态 信息 出 现 为 止 。 这 将 发 生 在 子 进程 
调用 exit 的 时 候 。 我 们 将 子 进程 的 退出 码 设 置 为 37。 父 进程 然后 继续 运 
行 ， 通 过 测试 wait 调 用 的 返回 值 来 判断 子 进 程 是 否 正 党 终止 。 如 果 是 ， 
就 从 状态 信息 中 提取 出 子 进 程 的 退出 码 。 


11.3.2 {Bute 


用 fork 来 创建 进程 确实 很 有 用 ， 但 你 必须 清楚 子 进程 的 运行 情况 。 
子 进 程 终止 时 ， 它 与 父 进程 之 间 的 关联 还 会 保持 ， 直 到 父 进程 也 正常 终 
止 或 父 进程 调用 wait 才 告 结束 。 因 此 ， 进 程 表 中 代表 子 进程 的 表 项 不 会 
立刻 释放 。 虽 然 子 进程 已 经 不 再 运行 ， 但 它 仍 然 存 在 于 系统 中 ， 因 为 它 
的 退出 码 还 需要 保存 起 来 ， 以 备 父 进 程 今后 的 wait 调 用 使 用 。 这 时 它 将 
成 为 一 个 死 Cdefunct) 进程 或 僵尸 (zombie) 进程 。 

如 果 修 改 fork 示 例 程 序 中 的 消息 输出 次 数 ， 我 们 就 能 看 到 僵尸 进 
程 。 如 果子 进程 输出 消息 的 次 数 少 于 父 进程 ， 它 就 会 率先 结束 并 成 为 僵 
尸 进程 直到 父 进程 也 结 


K 验 僵尸 进程 
fork2.c 和 fork1.c 基 本 一 样 ， 只 是 父 、 子 进程 输出 消 恩 的 次 数 对调 了 
一 下 。 下 面 是 相关 的 代码 行 : 


实验 解析 

如 果 用 。/fork2 & 命 令 来 运行 上 面 这 个 程序 ， 然 后 在 子 进程 结束 之 
后 父 进程 结束 之 前 调用 ps 程序 ， 我 们 将 会 看 到 如 下 阴影 显示 的 一 行 (一 
些 系 统 可 能 使 用 <zombie> 而 不 是 <defunct>) 。 


188 schedu pti 


如 果 此 时 父 进 程 寞 常 终止 ， 子 进程 将 自动 把 PID 为 1 的 进程 ( 即 
ini) 作为 目 己 的 父 进程 。 子 进程 现在 是 一 个 不 再 运行 的 僵尸 进程 ， 但 
因为 其 父 进 程 异常 终止 ， 所 以 它 由 init 进 程 接管 。 伪 尸 进程 将 一 直 保 留 
在 进程 表 中 直到 被 init 进 程 发 现 并 释放 。 进 程 表 越 大 ， 这 一 过 程 束 越 
慢 。 应 该 尽量 避免 产生 僵尸 进程 ， 因 为 在 init 清 理 它 们 之 前 ， 它 们 将 一 
直 消 耗 系统 的 资源 。 

还 有 刃 一 个 系统 调用 可 用 来 等 待 子 进程 的 结束 ， 它 是 waitpid 函 数 。 
你 可 以 用 它 来 等 待 东 个 特定 进程 的 结束 。 


pid 参 数 指定 需要 等 待 的 子 进 程 的 PID。 如 果 它 的 值 为 -1,waitpid 将 返 
回 任 一 子 进程 的 信息 。 与 wait 一 样 ， 如 果 stat_loc 不 是 空 指针 ，waitpid 将 
把 状态 信息 写 到 它 所 指向 的 位 置 。option 参 数 可 用 来 改变 waitpid 的 行 
为 ， 其 中 最 有 用 的 一 个 选项 是 WNOHANG， 它 的 作用 是 防止 waitpid 调 
用 将 调用 者 的 执行 挂 起 。 你 可 以 用 这 个 选项 来 查找 是 否 有 子 进程 已 经 结 
束 ， 如 果 没 有 ， 程 序 将 继续 执行 。 其 他 的 选项 和 wait 调 用 的 选项 相同 。 

因此 ， 如 果 想 让 父 进程 周期 性 地 检查 某 个 特定 的 子 进程 是 否 已 终 
止 ， 束 可 以 使 用 如 下 的 调用 方式 : 


waltpid(child_pid, (int *) 0，WNOHANG ) ; 


如 果子 进程 没有 结束 或 意外 终止 ， 它 就 返回 0， 和 否则 返回 
child_pid。 如 果 waitpid 失 败 ， 它 将 返回 -1 并 设置 errmmo。 失 败 的 情况 包 
fh: 没有 子 进程 (errno 设 置 为 ECHILD)〉 、 调 用 被 某 个 信号 中 断 
(EINTR) 或 选项 参数 无 效 (EINVAL) 。 


已 打开 的 文件 描述 符 将 在 fork 和 exec 调 用 之 后 保留 下 来 ， 我 们 可 以 
利用 对 进程 这 方面 知识 的 理解 来 改变 程序 的 行为 。 下 一 个 例子 涉及 一 个 
过 滤 程 序 : 它 从 标准 输入 读 取 数据 ， 然 后 回 标 准 输出 写 数 据 ， 同 时 在 输 
入 和 输出 之 间 对 数据 做 一 些 有 用 的 转换 。 


实 验 重 定向 
下 面 是 一 个 非常 简单 的 过 滤 程 序 upper.c， 它 读 取 输入 并 将 输入 字符 
转换 为 大 写 ， 


运行 这 个 程序 时 ， 它 按照 我 们 预期 的 那样 执行 ， 如 下 所 示 : 


当然 还 可 以 利用 shell 的 重 定 问 把 一 个 文件 的 内 容 全 部 转换 为 大 写 ， 
如 下 所 示 : 

如 果 我 们 想 在 另 一 个 程序 中 使 用 这 个 过 滤 程 序 会 发 生 什 么 情况 呢 ? 
下 面 这 个 程序 useupper.c 接 受 一 个 文件 名 作为 命令 行 参数 ， 如 果 对 它 的 
调用 不 正确 ， 它 将 啊 应 一 个 错误 信息 。 


重新 打开 标准 输入 ， 并 再 次 检查 有 无 错误 发 生 ， 然 后 用 execl 调 用 
Upper 程序: 


REE exec PS NE te. WRIA RAR, Fl PAI 
oe e 


实验 解析 

运行 这 个 程序 时 ， 我 们 可 以 提供 给 它 一 个 文件 ， 让 它 把 该 文件 的 内 
容 全 部 转换 为 大 写 。 这 项 工作 由 程序 upper 完 成 ， 但 它 并 不 处 理 文 件 名 
参数 。 注 意 ， 我 们 并 不 需要 upper 程 序 的 源 代码 。 我 们 可 以 利用 这 种 方 
法 运行 任何 可 执行 程序 : 


a 5 it file.t txt 


THE FILE, = IS ALL LOWER CASE. 


useupper 程 序 用 freopen 本数 先 关闭 标准 输入 ， 然后 将 文件 流 stdin 与 
程序 参数 给 定 的 文件 名 关联 起 来 。 接 下 来 ， 它 调用 execl 用 upper 程 序 蔡 
换 掉 正在 运行 的 进程 代码 。 因 为 已 打开 的 文件 描述 符 会 在 execl 调 用 之 后 
保留 下 来 ， 所 以 upper 程 序 的 运行 情况 和 它 在 shell 提 示 符 下 的 运行 情况 完 


5 ./upper < file.txt 


11.3.4 ”线程 
Linux 系 统 中 的 进程 可 以 互相 协作 、 互 相 发 送 消 轧 、 互 相 中 断 ， 甚 


至 可 以 共享 内 存 段 。 但 从 本 质 上 来 说 ， 它 们 是 操作 系统 内 各 自 独 立 的 实 
体 ， 要 想 在 它们 之 间 共 享 变 量 并 不 是 很 容易 。 

在 许多 UNIX 和 Linux 系 统 中 都 有 一 类 进程 叫做 线程 (thread) 。 涉 
及 线程 的 编程 是 比较 困难 的 ， 但 它 在 某 些 应 用 软件 (如 多 线程 数据 库 服 
务 器 ) 中 又 有 很 大 的 用 处 。 在 Linux 〈 或 UNIX) 系统 中 编写 线程 程序 并 
不 像 编 写 多 进程 程序 那么 常见 ， 因 为 Linux 中 的 进程 都 是 非常 轻 量 级 
的 ， 而 且 编 写 多 个 互相 协作 的 进程 比 编写 线程 要 容易 得 多 。 我 们 将 在 第 
12 章 介绍 线程 。 


11.4 ”信号 


信号 是 UNIX 和 Linux 系 统 啊 应 东 些 条 件 而 产生 的 一 个 事件 。 接 收 到 
该 信号 的 进程 会 相应 地 采取 一 些 行动 。 我 们 用 术语 生成 Craise) 表示 一 
个 信号 的 产生 ， 使 用 术语 捕获 〈catch) 表示 接收 到 一 个 信号 。 信 号 是 由 
于 茶 些 错误 条 件 而 生成 的 ， 如 内 存 段 冲 突 、 浮 点 处 理 需 错误 或 非法 指令 
等 。 它 们 由 shell 和 终端 处 理 器 生成 来 引起 中 断 ， 它 们 还 可 以 作为 在 进程 
间 传 递 消息 或 修改 行为 的 一 种 方式 ， 明 确 地 由 一 个 进程 友 送 给 另 一 个 进 
程 。 无 论 何 种 情况 ， 它 们 的 编程 接口 都 是 相同 的 。 信 和 号 可 以 被 生成 、 捕 
获 、 啊 应 或 〈 至 少 对 于 一 些 信 号 ) 忽略 。 

信号 的 名 称 是 在 头 文件 signal.h 中 定义 的 。 它 们 以 SIG 开 头 ， 见 表 11- 


3。 


表 11-3 


* 系 统 对 信号 的 啊 应 视 具 体 实现 而 定 。 


如 采 进 程 接收 到 这 些 信号 中 的 一 个 ， 但 事先 没有 安排 捕获 它 ， 进 程 
将 会 立刻 终止 。 通 党， 系统 将 生成 核心 转 储 文 件 core， 并 将 其 放 在 当前 
目录 下 。 该 文件 是 进程 在 内 存 中 的 映像 ， 它 对 程序 的 调试 很 有 用 处 。 

其 他 信号 见 表 11-4。 


表 11-4 


f 1 


默认 情况 下 ， 它 是 被 忽略 
的 。 其 余 的 信号 会 使 接收 它们 的 进程 停止 运行 ， 但 SIGCONT 是 个 例 

外 ， 它 的 作用 是 让 进程 恢复 并 继续 执行 。shell 脚 本 通过 它 来 控制 作业 ， 
但 用 户 程序 很 少 会 用 到 它 。 

稍 后 我 们 将 对 表 11-3 中 的 信号 做 进一步 的 介绍 。 现 在 ， 我 们 只 需 知 
道 如 果 shell 和 终端 驱动 程序 是 按 通 浓 情 况 配置 的 话 ， 在 键 各 上 剖 入 中 晰 
字符 〈 通 常 是 Ctrl+C 组 合 键 ) 就 会 癌 前 台 进 程 〈 即 当前 正在 运行 的 程 
Æ) 发 送 SIGINT 信 号 ， 这 将 引起 该 程序 的 终止 ， 除 非 它 事先 安排 了 捕 
狭 这 个 信号 。 

如 果 想 发 送 一 个 信号 给 进程 ， 而 该 进程 并 不 是 当前 的 前 台 进 程 ， 就 
需要 使 用 k 记 命令 。 该 命令 需要 有 一 个 可 选 的 信号 代码 或 信号 名 称 和 一 
个 接收 信和 号 的 目标 进程 的 PID 〈 这 个 PID 一 般 需 要 用 ps 命令 查 出 来 ) 。 例 
如 ， 如 果 要 向 运行 在 另 一 个 终端 上 的 PID 为 512 的 进程 发 送 “ 挂 断 ” 信 号 ， 
可 以 使 用 如 下 命令 : 


$ kill -HUP 512 


kill 命 令 有 一 个 有 用 的 变 体 叫 killall， 它 可 以 给 运行 着 某 一 命令 的 所 
有 进程 发 送信 号 。 并 不 是 所 有 的 UNIX 系 统 都 支持 它 ， 但 Linux 系 统一 般 
都 有 该 命令 。 如 果 不 知 道 某 个 进程 的 PITD， 或 者 想 给 执行 相同 命令 的 许 
多 不 同 的 进程 发 送信 号 ， 这 条 命令 就 很 有 用 了 。 一 种 常见 的 用 法 是 ， 通 
知 inetd 程 序 重新 读 取 它 的 配置 选项 ， 要 完成 这 一 工作 ， 可 以 使 用 下 面 这 


条 命令 : 


SIGCHLD 信 号 对 于 管理 子 进 程 很 有 用 。 


$ killall -HUP inetd 
程序 可 以 用 signal 库 函数 来 处 理 信 号 ， 它 的 定义 如 下 所 示 : 


#include <signal.h> 
void (*signal(int sig, void (*func) (int))) (int); 

这 个 相当 复杂 的 函数 定义 说 明 ，signal 是 一 个 带 有 sig 和 func 了 两 个 参 
数 的 函数 。 准 备 捕 获 或 忽略 的 信号 由 参数 sig 给 出 ， 接 收 到 指定 的 信号 后 
将 要 调用 的 函数 由 参数 func 给 出 。 信 号 处 理 函 数 必 须 有 一 个 int 类 型 的 参 
数 《“ 即 接收 到 的 信号 代码 ) 并 且 返 回 类 型 为 void。signal 函 数 本 吴 也 返回 


一 个 同类 型 的 函数 ， 即 先前 用 来 处 理 这 个 信号 的 函数 ， 或 者 也 可 以 用 表 
11-5 中 的 两 个 特殊 值 之 一 来 代 符 信号 处 理 函 数 。 


表 11-5 


通过 一 个 实例 可 以 更 清楚 地 理解 信号 的 处 理 方 法 。 下 面 我 们 来 编写 
一 个 程序 ctrlcc， 它 将 啊 应 用 户 禹 入 的 Ctrl+C 组 合 键 ， 在 屏幕 上 打印 一 
条 适当 的 消 妃 而 不 是 终止 程序 的 运行 。 当 用 户 第 二 次 按 下 Ctrl+C 时 ， 程 
序 将 结束 运行 。 


X 验 信号 处 理 

函数 ouch 对 通过 参数 sig 传 递 进 来 的 信号 作出 响应 。 信 和 号 出 现时 ， 程 
序 调 用 该 函数 ， 它 先 打 印 一 条 消息 ， 然 后 将 信号 SIGINT 〈 默 认 情 况 
下 ， 按 下 Ctrl+C 将 产生 这 个 信号 ) 的 处 理 方 式 恢 复 为 默认 行为 。 


main 函 数 的 作用 是 ， 和 截获 按 下 Ctrl+C 组 合 键 时 产生 的 SIGINT 信 号。 
没有 信号 出 现时 ， 它 会 在 一 个 无 限 循环 中 每 隔 一 秒 打印 一 条 消息 。 


第 一 次 按 下 Ctrl+C 组 合 键 会 让 程序 作出 啊 应 ， 然 后 程序 继续 执行 。 


再 次 按 下 Ctm+C 组 合 键 时 ， 程 序 将 结束 运行 ， 因 为 SIGINT 信 号 的 处 理 方 
式 已 恢复 为 默认 行为 终止 程序 的 运行 。 


$ ./etricl 


在 此 例 中 我 们 可 以 看 到 ， 信 和 号 处 理 函 数 使 用 了 一 个 单独 的 整数 参 
数 ， 它 就 是 引起 该 函数 被 调用 的 信号 代码 。 如 果 需 要 在 同一 个 冰 数 中 处 
理 多 个 信号 ， 这 个 参数 就 很 有 用 。 在 本 例 中 ， 我 们 打印 出 SIGINT 的 
值 ， 它 的 值 在 这 个 系统 中 恰好 是 2， 但 你 不 能 过 分 依赖 传统 的 信号 数字 
值 ， 而 应 该 在 新 的 程序 中 总 古 使 用 信号 的 名 他。 


在 信号 处 理 函 数 中 ， 调 用 如 Printf 这 样 的 函数 是 不 安全 的 。 一 

个 有 用 的 技巧 是 ， 在 信 写 处 理 函 数 中 设置 一 个 标志 ， 然 后 在 主 程序 

中 检查 该 标志 ， 如 需要 就 打印 一 条 消息 。 在 本 章 的 结尾 部 分 ， 你 将 

人 
调用 。 


实验 解析 

程序 中 安排 函数 ouch 来 处 理 在 按 下 Ctrl+C 组 合 键 时 所 产生 的 SIGINT 
信号 。 程 序 会 在 中 断 函 数 ouch 处 理 完毕 后 继续 执行 ， 但 信号 处 理 方式 已 
恢复 为 默认 行为 〈 不 同 版 本 的 UNIX 系 统 ， 特 别 是 从 Berkley UNIX 和 衍生 
出 来 的 那些 版 本 ， 在 对 信号 的 处 理 方 式 上 从 历史 上 就 有 些 细 微 的 不 同 。 
如 果 想 让 信号 的 处 理 方 式 在 信号 发 生 后 恢复 到 其 默认 行为 ， 最 好 的 方法 
就 是 自己 写 出 具体 的 信号 处 理 代 码 ) 。 当 它 接收 到 第 二 个 SIGINT 信 和 号 
后 ， 程 序 将 采取 默认 的 行动 ， 即 终止 程序 的 运行 。 

如 果 想 保留 信号 处 理 函 数 ， 让 它 继续 响应 用 户 的 Ctrl+C 组 合 键 ， 我 
们 就 需要 再 次 调用 signal 函 数 来 重新 建立 它 。 这 会 使 信号 在 一 段 时 间 内 
无 法 得 到 处 理 ， 这 段 时 间 从 调用 中 断 函 数 开 始 ， 到 信和 号 处 理 函 数 的 重建 
为 止 。 如 果 在 这 段 时 间 内 程序 接收 到 第 二 个 信号 ， 它 就 会 违背 我 们 的 意 
愿 终止 程序 的 运行 。 


我 们 不 推荐 大 家 使 用 signal 接 口 。 之 所 以 会 在 这 里 介绍 它 ， 是 
因为 你 可 能 会 在 许多 老 程序 中 看 到 它 的 应 用 。 稍 后 我 们 会 介绍 一 个 
定义 更 清晰 、 执 行 更 可 靠 的 函数 sigaction， 在 所 有 的 新 程序 中 都 应 
该 使 用 这 个 函数 。 


signal 函 数 返 回 的 是 先前 对 指定 信号 进行 处 理 的 信号 处 理 函 数 的 函 
数 指针 ， 如 果 未 定义 信号 处 理 函 数 ， 则 返回 SIG_ERR 并 设置 errno 为 一 个 
正 数 值 。 如 果 给 出 的 是 一 个 无 效 的 信号 ， 或 者 尝试 处 理 的 信号 是 不 可 捕 
获 或 不 可 忽略 的 信号 〈 如 SIGKILL ) ,errmno 将 被 设置 为 EINVAL。 


11.4.1 发 送信 号 


进程 可 以 通过 调用 k 记 函数 同 包 括 它 本 映 在 内 的 其 他 进程 发送 一 个 
信和 号。 如果 程序 没有 发 送 该 信号 的 权限 ， 对 kil 函 数 的 调用 就 将 失败 ， 
失败 的 常见 原因 是 目标 进程 由 另 一 个 用 户 所 拥有 。 这 个 函数 和 同名 的 
shell 命 令 完成 相同 的 功能 ， 它 的 定义 如 下 所 示 : 


k 记 函数 把 参数 sig 给 定 的 信号 发 送 给 由 参数 PID 给 出 的 进程 号 所 指定 
的 进程 ， 成 功 时 它 返回 0。 要 想 发 送 一 个 信号 ， 发 送 进程 必须 拥有 相应 
的 权限 。 这 通常 意味 着 两 个 进程 必须 拥有 相同 的 用 户 ID 〈 即 你 只 能 发 送 
信号 给 属于 自己 的 进程 ， 但 超级 用 户 可 以 发 送信 号 给 任何 进程 ) 。 

kill 调 用 会 在 失败 时 返回 -1 并 设置 errno 变 量 。 失 败 的 原因 可 能 是 : 
给 定 的 信号 无 效 (errno 设 置 为 EINVAL) ; 发 送 进 程 权限 不 够 (errno 设 
置 为 EPERM) ; 目标 进程 不 存在 〈errno 设 置 为 ESRCH) 。 

信号 向 我 们 提供 了 一 个 有 用 的 闸 钟 功能 。 进 程 可 以 通过 调用 alarm 
函数 在 经 过 预定 时 间 后 发 送 一 个 SIGALRM 信 和 号 。 


#include <unistd.h> 


unsigned int alarm(unsigned int seconds); 


alarm K% H RK fEseconds#) Z Ja AFAIE—TSIGALRM{a y o {AEH 
于 处 理 的 延 时 和 时 间 调 度 的 不 确定 性 ， 实 际 闹钟 时 间 将 比 预先 安排 的 要 
稍微 拖 后 一 点 儿 。 把 参数 seconds 设 置 为 0 将 取消 所 有 已 设置 的 闹钟 请 
求 。 如 果 在 接收 到 SIGALRM 信 号 之 前 再 次 调用 alarm 函 数 ， 则 闹钟 重新 
开始 计时 。 每 个 进程 只 能 有 一 个 闹钟 时 间 。alarm 函 数 的 返回 值 是 以 前 
设置 的 闹钟 时 间 的 余 留 秒 数 ， 如 果 调 用 失败 则 返回 -1。 

为 了 说 明 alarm 函 数 的 工作 情况 ， 我 们 通过 使 用 fork、sleep 和 signal 
来 模拟 它 的 效果 。 程 序 可 以 启动 一 个 新 的 进程 ， 它 专门 用 于 在 未 来 的 某 
一 时 刻 发 送 一 个 信和 号。 


实 验 模拟 一 个 阅 钟 
alarm.c 程 序 里 的 第 一 个 函数 ding 的 作用 是 模拟 一 个 闹钟 。 


在 main 函 数 中 ， 我 们 告诉 子 进 程 在 等 待 5 秒 后 发 送 一 个 SIGALRM 信 
号 给 它 的 父 进程 。 


SIGALRM) } 


父 进程 通过 一 个 signal 调 用 安排 好 捕获 SIGALRM 信 号 的 工作 ， 然 后 
等 待 它 的 到 来 。 


are the parent process * 


pause 


运行 这 个 程序 时 ， 它 会 暂停 5 秒 ， 等 待 模拟 闹钟 的 闹 响 。 


5 ./alarm 


这 个 程序 用 到 了 一 个 新 的 函数 pause， 它 的 作用 很 简单 ， 就 是 把 程 
序 的 执行 挂 起 直到 有 一 个 信号 出 现 为 止 。 当 程序 接收 到 一 个 信号 时 ， 预 
设 好 的 信号 处 理 函 数 将 开始 运行 ， 程 序 也 将 恢复 正 帝 的 执行 。 pause 
数 的 定义 如 下 所 示 : 


#include <unistd.h> 


int pause(void); 


当 它 被 一 个 信号 中 断 时 ， 将 返回 -1 (如 果 下 一 个 接收 到 的 信号 没有 导致 
程序 终止 的 话 ) 并 把 ermo 设 置 为 EINTR。 当 需要 等 待 信号 时 ， 一 个 更 常 
见 的 方法 是 使 用 稍 后 将 要 介绍 的 Sigsuspend 函 数 。 

实验 解析 

闸 钟 模拟 程序 通过 fork 调 用 启动 新 的 进程 。 这 个 子 进程 休眠 5 秒 后 问 
其 父 进程 发 送 一 个 SIGALRM 信 号 。 父 进程 在 安排 好 捕获 SIGALRM 信 和 号 
后 暂停 运行 ， 直 到 接收 到 一 个 信号 为 止 。 我 们 并 未 在 信号 处 理 函 数 中 直 
接 调 用 printf， 而 是 通过 在 该 函数 中 设置 标志 ， 然 后 在 main 函 数 中 检 碍 
该 标志 来 完成 消息 的 输出 。 

使 用 信号 并 挂 起 程序 的 执行 是 Linux 程 序 设计 中 的 一 个 重要 部 分 。 
这 意味 着 程序 不 需要 总 是 在 执行 着 。 程 序 不 必 在 一 个 循环 中 无 休止 地 检 
查 某 个 事件 是 否 已 发 生 ， 相 反 ， 它 可 以 等 待 事件 的 发 生 。 这 在 只 有 一 个 
CPU 的 多 用 户 环境 中 尤其 重要 ， 进 程 共享 着 一 个 处 理 器 ， 繁 忙 的 等 待 将 
会 对 系统 的 性 能 造成 极 大 的 影响 。 程 序 中 信号 的 使 用 将 带 来 一 个 特殊 的 
问题 : “如 果 信 号 出 现在 系统 调用 的 执行 过 程 中 会 发 生 什 么 情况 ? ”答案 
是 相当 让 人 不 满意 的 “ 视 情况 而 定 ”。 一 般 来 说 ， 你 只 需要 考虑 慢 系 统 调 
用 ， 例 如 从 终端 读数 据 ， 如 果 在 这 个 系统 调用 等 竺 数据 时 出 现 一 个 信 
号 ， 它 就 会 返回 一 个 错误 。 如 果 你 开始 在 自己 的 程序 中 使 用 信号 ， 就 需 
要 注意 一 些 系 统 调用 会 因为 接收 到 了 一 个 信号 而 失败 ， 而 这 种 错误 情况 
可 能 是 你 在 添加 信号 处 理 函 数 之 前 没有 考虑 到 的 。 

在 编写 程序 中 处 理 信号 部 分 的 代码 时 必须 非常 小 心 ， 因 为 在 使 用 信 
写 的 程序 中 会 出 现 各 种 各 样 的 “ 苋 态 条 件 ”。 例 如 ， 如 果 想 调用 pause 等 待 
一 个 信号 ， 可 信号 却 出 现在 调用 pause 之 前 ， 就 会 使 程序 无 限期 地 等 待 
一 个 不 会 发 生 的 事件 。 这 些 竞 态 条 件 都 是 一 些 对 时 间 要 求 很 奇 刻 的 问 
题 ， 许 多 编程 新 手 都 有 这 方面 的 烦恼 ， 所 以 在 检查 和 信和 号 相关 的 代码 时 


总 是 要 非常 小 心 。 


一 个 健壮 的 信号 接口 

我 们 已 经 对 用 signal 和 其 相关 函数 来 生成 和 捕获 信号 做 了 比较 深 
的 介绍 ， 因 为 它们 在 传统 的 UNIX 编 程 中 很 常见 。 但 X/Open 和 UNIX 规 范 
推荐 了 一 个 更 新 和 更 健壮 的 信号 编程 接口 : sigaction。 它 的 定义 如 下 所 
ZN: 


#include <signal.h> 


int sigaction(int sig, const struct sigaction *act, struct sigaction *oact); 


sigaction 结 构 定 义 在 文件 signal.h 中 ， 它 的 作用 是 定义 在 接收 到 参数 


sig 指 定 的 信号 后 应 该 采取 的 行动 。 该 结构 至 少 应 该 包括 以 下 几 个 成 员 : 


sigaction 函 数 设置 与 信号 sig 关 联 的 动作 。 如 果 oact 不 是 空 指 针 ， 
sigaction 将 把 原先 对 该 信号 的 动作 写 到 它 指 癌 的 位 置 。 如 果 act 是 空 指 
针 ， 则 sigaction 函 数 束 不 需要 再 做 其 他 设置 了 ， 否 则 将 在 该 参数 中 设置 
对 指定 信号 的 动作 。 

与 signal 函 数 一 样 ，sigaction 疯 数 会 在 成 功 时 返回 9， 失 败 时 返 
回 -1。 如 果 给 出 的 信和 号 无 效 或 者 试图 对 一 个 不 允许 被 捕获 或 忽略 的 信和 号 
进行 捕获 或 忽略 ， 错 误 变 量 ermo 将 被 设置 为 EINVAL。 

在 参数 act 指 向 的 sigaction 结 构 中 ，sa_handler 是 一 个 函数 指针 ， 它 指 
向 接收 到 信号 sig 时 将 被 调用 的 信号 处 理 函 数 。 它 相当 于 前 面 见 到 的 传递 
给 函数 signal 的 参数 func。 我 们 可 以 将 Sa_handler 字 段 设 置 为 特殊 值 
SIG_IGN 和 SIG_DFL， 它 们 分 别 表示 信和 号 将 被 忽略 或 把 对 该 信号 的 处 理 
方式 恢复 为 默认 动作 。 

sa_mask 成 员 指 定 了 一 个 信号 集 ， 在 调用 sa_handler 所 指 同 的 信号 处 
理 函 数 之 前 ， 该 信号 集 将 被 加 入 到 进程 的 信号 屏蔽 字 中 。 这 是 一 组 将 被 
阻塞 且 不 会 传递 给 该 进程 的 信号 。 设 置信 号 屏蔽 字 可 以 防止 前 面 看 到 的 
信号 在 它 的 处 理 函 数 还 未 运行 结束 时 就 被 接收 到 的 情况 。 使 用 sa_mask 
字段 可 以 消除 这 一 竞 态 条 件 。 

但 是 ， 由 sigaction 函 数 设置 的 信号 处 理 函 数 在 默认 情况 下 是 不 被 重 
置 的 ， 如 果 和 希望 获得 类 似 前 面 用 第 二 次 signal 调 用 对 信和 号 处 理 进 行 重 置 
的 效果 ， 就 必须 在 sa_flags 成 员 中 包含 值 SA_RESETHAND。 在 深入 了 解 
sigaction 函 数 之 前 ， 我 们 先 用 sigaction 蔡 换 signal 来 重 写 程序 ctrlc.c。 


S 验 sigaction 函 数 
按照 下 面 给 出 的 代码 修改 我 们 的 程序 ， 用 sigaction 来 截获 SIGINT 信 
号 。 我 们 将 新 的 程序 命名 为 ctrlc2.C。 


运行 这 个 新 版 程序 时 ， 只 要 按 下 Ctrl+C 组 合 键 ， 就 可 以 看 到 一 条 消 
。 因 为 sigaction 函 数 连续 处 理 到 来 的 SIGINT 信 号 。 要 想 终 止 这 个 程 
我 们 只 能 按 下 Ctrl+\ 组 合 键 ， 它 在 默认 情况 下 产生 SIGQUIT 信 号 。 


Ht CI 


实验 解析 

这 个 程序 用 sigaction 代 符 signal 来 设置 Ctrl+C 组 合 键 〈SIGINT 信 号 ) 
的 信号 处 理 函 数 为 ouch。 它 首先 必须 设置 一 个 Sigaction 结 构 ， 在 该 结构 
中 包含 信号 处 理 函 数 、 信 和 号 屏蔽 字 和 标志 。 在 本 例 中 ， 我 们 不 需要 设置 
任何 标志 ， 并 通过 调用 新 的 函数 sigemptyset 来 创建 空 的 信号 屏蔽 字 。 


运行 完 这 个 程序 后 ， 你 将 发 现在 当前 目录 下 多 了 一 个 core 文 
件 ， 你 可 以 安全 地 删除 它 。 


11.4.2 信号 集 


头 文件 signalh 定 义 了 类 型 sigset t 和 用 来 处 理 信 号 集 的 函数 。 
sigaction 和 其 他 函数 将 用 这 些 信 号 集 来 修改 进程 在 接收 到 信和 号 时 的 行 


#include <signal.h> 


int sigaddset(sigset_t *set, int signo); 
int sigemptyset(sigset_t *set); 
int sigfillset(sigset_t *set); 
int sigdelset(sigset_t *set, int signo); 


这 些 函 数 执行 的 操作 如 它们 的 名 字 所 示 。sigemptyset 将 信号 集 初 始 
化 为 空 。sigfillset 将 信和 号 集 初 始 化 为 包含 所 有 已 定义 的 信号。 sigaddset 和 
sigdelset 从 信号 集中 增加 或 删除 给 定 的 信号 Csigno) 。 它 们 在 成 功 时 返 
回 0， 失 败 时 返回 -1 并 设置 errno。 只 有 一 个 错误 代码 被 定义 ， 即 当 给 定 
的 信号 无 效 时 ，errno 将 设置 为 EINVAL。 

aa 的 信号 是 否 是 一 个 信号 集 的 成 员 。 如 
果 是 就 返回 1;， 如 果 不 是 ， 它 就 返回 0; 如 果 给 定 的 信号 无 效 ， 它 就 返 
回 -1 并 设置 errno 为 EINVAL。 


#include <signal.h> 


进程 的 信和 号 屏蔽 字 的 设置 或 检查 工作 由 函数 sigprocmask 来 完成 。 信 
屏 菩 字 是 指 当 前 个 阻 暑 的 一 组 信号 ， 它 们 不 能 被 当前 进程 接收 到 。 


#include <signal.h> 


int sigprocmask(int how, const sigset_t *set, sigset t *oset); 


sigprocmask 函 数 可 以 根据 参数 how 指 定 的 方法 修改 进程 的 信号 屏蔽 
字 。 新 的 信号 屏蔽 字 由 参数 set (如 果 它 不 为 空 ) 指定 ， ii BRAG HOS ER 
蔽 字 将 保存 到 信号 集 oset 中 。 

参数 how 的 取 值 可 以 是 表 11-6 中 的 一 个 。 


表 11-6 


把 信号 屏 项 字 设 壬 为 参数 1 


如 果 参 数 set 是 空 和 针 ，how 的 值 束 没有 意义 了 ， 此 时 这 个 调用 的 唯 
一 目的 束 是 把 当前 信号 屏蔽 字 的 值 保存 到 oset 中 。 

如 果 sigprocmask 成 功 完 成 ， 它 将 返回 0; 如 果 参 数 how 取 值 无 效 ， 
它 将 返回 -1 并 设置 errno 为 EINVAL。 

如 果 一 个 信号 被 进程 阻塞 ， 它 就 不 会 传递 给 进程 ， 但 会 停留 在 待 处 
理 状 态 。 程 序 可 以 通过 调用 函数 sigpending 来 查看 它 阻塞 的 信号 中 有 哪 


些 正 停留 在 待 处 理 状 态 。 
#include <signal.h> 


int sigpending(sigset_t *set); 


这 个 函数 的 作用 是 ， 将 被 阻塞 的 信号 中 停留 在 待 处 理 状态 的 一 组 信 
号 写 到 参数 set 指 向 的 信号 集中 。 成 功 时 它 将 返回 0， 和 否则 返回 -1 并 设置 
errmo 以 表明 错误 的 原因 。 如 果 程 序 需要 处 理 信 号 ， 同 时 又 需要 控制 信号 
处 理 函 数 的 调用 时 间 ， 这 个 函数 就 很 有 用 了 。 

进程 可 以 通过 调用 sigsuspend 函 数 挂 起 自己 的 执行 ， 直 到 信号 集中 
M RESDA MERNI AAN pansem EE 
现形 式 。 


#include <signal.h> 


sigsuspend 函 数 将 进程 的 屏蔽 字符 换 为 由 参数 sigmask 给 出 的 信和 号 
集 ， 然 后 挂 起 程序 的 执行 。 程 序 将 在 信号 处 理 函 数 执行 完毕 后 继续 执 
行 。 如 果 接 收 到 的 信号 终止 了 程序 ，sigsuspend 就 不 会 返回 ; 如 果 接 收 
到 的 信号 没有 终止 程序 ，sigsuspend 就 返回 -1 并 将 errno 设 置 为 EINTR.。 

1. sigaction 标 志 

用 在 sigaction 函 数 里 的 sigaction 结 构 中 的 sa_flags 字 段 可 以 包含 表 11- 
7 中 的 取 值 ， 它 们 用 于 改变 信号 的 行为 。 


表 11-744 


| PE UE, 


当 一 个 信号 被 捕获 时 ，SA_RESETHAND 标 志 可 以 用 来 自动 清除 它 
的 信号 处 理 函 数 ， 就 如 同 我 们 在 前 面 所 看 到 的 那样 。 

程序 中 使 用 的 许多 系统 调用 都 是 可 中 断 的 。 也 就 是 说 ， 当 接收 到 一 
个 信号 时 ， 它 们 将 返回 一 个 错误 并 将 errno 设 置 为 EINTR， 表 明 函 数 是 因 
为 一 个 信号 而 返回 的 。 使 用 了 信号 的 应 用 程序 需要 特别 注意 这 一 行为 。 
如 果 sigaction 调 用 中 的 sa_flags 字 上 段 设 置 了 SA_RESTART 标 志 ， 那 么 在 信 
号 处 理 函 数 执 行 完 之 后 ， 函 数 将 被 重启 而 不 是 被 信号 中 断 。 

一 般 的 做 法 是 ， 信 号 处 理 函 数 正 在 执行 时 ， 新 接收 到 的 信号 将 在 该 
处 理 函 数 的 执行 期 间 被 添加 到 进程 的 信号 屏蔽 字 中 。 这 防止 了 同一 信号 
的 不 断 出现 引 起 信号 处 理 函 数 的 再 次 和 运行。 如 果 信 号 处 理 函 数 是 一 个 不 
可 重 入 的 函数 ， 在 它 结束 对 第 一 个 信号 的 处 理 之 前 又 让 另 一 个 信号 再 次 
调用 它 束 有 可 能 引起 问题 。 但 如 果 设 置 了 SA_NODEFER 标 志 ， 当 程序 


接收 到 这 个 信号 时 就 不 会 改变 信和 号 屏蔽 字 。 

信号 处 理 函 数 可 以 在 其 执行 期 间 被 中 断 并 再 次 被 调用 。 当 返回 到 第 
一 次 调用 时 ， 它 能 否 继续 正确 操作 是 很 关键 的 。 这 不 仅仅 是 递归 〈 调 用 
自身 ) 的 问题 ， 而 是 可 重 入 (可 以 安全 地 进入 和 再 次 执行 ) 的 问题 。 
Linux 内 核 中 ， 在 同一 时 间 负 责 处 理 多 个 设备 的 中 断 服务 例 程 就 需要 是 
Be eee ee ene i i 

表 11-8 中 列 出 的 是 可 以 在 信号 处 理 函 数 中 安全 调用 的 函数 。X/Open 
规范 保证 它们 都 是 可 重 入 的 或 者 本 身 不 会 再 生成 信号 的 。 


所 有 未 列 在 表 11-8 中 的 函数 ， 在 涉及 信号 处 理 时 ， 都 被 认为 是 
不 安全 的 。 


表 11-8 


2. HA SES 
在 这 一 小 节 ， 我 们 列 出 Linux 和 UNIX 程 序 常 用 的 信号 及 其 默认 行 


为 。 

表 11-9 中 信和 号 的 默认 动作 都 是 异常 终止 进程 ， 进 程 将 以 _exit 调 用 方 
式 退 出 〔 它 类 似 exit， 但 在 返回 到 内 核 之 前 不 作 任何 清理 工作 〉，。 但 进 
程 的 结束 状态 会 传递 到 wait 和 waitpid 函 数 中 去 ， 从 而 表明 进程 是 因 某 个 
特定 的 信号 而 异 第 终止 的 。 


表 11-9 


EAH gk FA 
SIGALAK ia Lari Me BR Oe it Be 
3IGHUT ‘a PAC PAF MEERA A RES RE. OPT de REY AE N ee I A g 
fig 
SIGINT BR EM PRA CHC r aR AE R F PIE IS 
KTI HARANA, EL Eskli AEKA E ER 

SIGPIPE MREP A SRR. MAA ERMAS 

TSTERM 作为 一 个 请 求 被 发 送 ， 旨 求 进程 半 束 运行 . UNIX 在 关机 时 用 这 个 信号 要 求 系统 酸 务 修 十 

运行 ， 它 是 xii1 命 今 默 认 发 送 的 信号 
进程 之 间 可 以 用 这 个 信 号 进行 通 迟 ， 例 如 让 进程 报告 状态 信息 等 


默认 情况 下 ， 表 11-10 中 的 信和 号 也 会 引起 进程 的 异常 终止 。 但 可 能 
还 会 有 一 些 与 具体 实现 相关 的 其 他 动作 ， 比 如 创建 core 文 件 等 。 


# 11-10 
=... oi _ 说 明 
SIGPPE HF? SLE SLR H 
SIGILL 处 理 器 执行 了 -条 非法 的 指令 ,这 通常 是 由 niger ERAS RAHA ES 
SIGQUIT WL tt MA RA Cort A a PR EP 
SIGSEGV Bur H. IRA ARATE POCA ht RY SAM. CP et 引用 无 效 指 
针 。 当 函数 返回 到 一 个 非法 地 址 时 ， 甩 赣 局 部 数组 变量 和 引起 栈 谢 鼻 都 会 引发 = ww 信号 
> Ey >H pO 2 O > 
默认 情况 下 ， 进 程 接收 到 列 在 表 11-11 中 的 > Rb SWE. 
# 11-11 
信号 名 称 说 遇 
SIGSTOP 停止 执行 《不 能 被 大 次 或 忽略 } 
SIGTSTP 终 减 提起 信忠。 通常 因 按 下 Curt*Z 组 合 键 而 产生 
SIGTTIN, SIGTTOU aa {i SRG HH NER 


输入 或 产生 给 出 而 暂停 运行 


SIGCONT 信 号 的 作用 eae 如 果 进 程 没 有 和 暂停 ， 
则 灸 略 该 信号 。SIGCHLD 信 和 号 在 默认 情况 下 被 忽略 。 


表 11-12 
EEA 说 Ca 
SIGOONT 如 果 进 程 被 暂停 ， 就 继续 执行 
SIGCHLA tia hed 8) ti E 


11.5 “N45 


在 本 章 中 ， 我 们 知道 了 进程 是 如 何 成 为 Linux 操 作 系 统 的 一 个 基本 
组 成 部 分 的 。 我 们 学 习 了 如 何 局 动 进程 、 终 止 进程 和 碍 看 进程 ， 如 何 用 
它们 来 解决 程序 设计 问题 。 我 们 还 介绍 了 信号 这 种 可 以 用 来 控制 程序 运 
行 行为 的 事件 。 此 外 ， 我 们 还 了 解 了 所 有 的 Linux 进 程 ， 包 括 init 在 内 ， 
a a cee 
To 


世 这 里 指 的 是 进程 暂 俘 ， 当 了 于 进程 终止 时 ， 仍 旧 会 产生 SIGCHLD 信 
译 者 注 


12% POSIX 线 程 


在 第 11 章 中 ， 我 们 介绍 了 如 何在 Linux (包括 UNIX) 中 处 理 进 
程 。 类 UNIX 操 作 系统 早 就 具备 这 种 多 进程 功能 了 。 但 有 时 人 们 认为 ， 
用 fork 调 用 来 创建 新 进程 的 代价 太 高 。 在 这 种 情况 下 ， 如 采 能 让 一 个 进 
程 同时 做 两 件 事情 或 至 少 看 起 来 是 这 样 将 会 非常 有 有 用。 而且， 你 可 能 希 
望 能 有 两 件 或 更 多 的 事情 以 一 种 非 癌 紧密 的 方式 同时 有 发生 。 这 就 是 需要 
线程 发 挥 作用 的 时 候 了 。 

在 本 章 中 ， 我 们 将 介绍 以 下 内 容 : 

口 在 进程 中 创建 新 线程 

O 在 一 个 进程 中 同步 线程 之 间 的 数据 访问 

O 修改 线程 的 属性 

口 在 同一 个 进程 中 ， 从 一 个 线程 中 控制 力 一 个 线程 


12.1 么 是 线程 


在 一 个 程序 中 的 多 个 执行 路 线 就 叫做 线程 (thread) 。 更 准确 的 定 
义 是 : 线程 是 一 个 进程 内 部 的 一 个 控制 序列 。 虽 然 Linuxz 和 许多 其 他 的 
操作 系统 一 样 ， 都 擅长 同时 运行 多 个 进程 ， 但 迄今 为 止 我 们 看 到 的 所 有 
程序 在 执行 时 都 是 作为 一 个 单独 的 进程 。 事 实 上， 所 有 的 进程 都 至 少 有 
a 到 目前 为 止 ， 在 本 书 中 看 到 的 所 有 进程 都 只 有 一 个 执行 
EXT o 

型 清楚 fork 系 统 调 用 和 创建 新 线程 之 间 的 区 别 非常 重要 。 当 进程 执 
行 fork 调 用 时 ， 将 创建 出 该 进程 的 一 份 新 副本 。 这 个 新 进程 拥有 自己 的 
变量 和 自己 的 PPD， 它 的 时 间 调 度 也 是 独立 的 ， 它 的 执行 〈 通 常 ) 几乎 
完全 独立 于 父 进程 。 当 在 进程 中 创建 一 个 新 线程 时 ， 新 的 执行 线程 将 拥 
有 自己 的 栈 〈 因 此 也 有 自己 的 局 部 变量 ) ， 但 与 它 的 创建 者 共享 全 局 变 
量 、 文 件 描述 符 、 信 和 号 处 理 函 数 和 当前 目录 状态 。 

线程 的 概念 已 经 出 现 一 段 时 间 了 ， 但 在 IEEE POSIX 委 员 会 发 布 有 
关 标 准 之 前 ， 它 们 并 没有 在 类 UNIX 操 作 系 统 中 得 到 广泛 支持 ， 而 且 已 
存在 的 线程 实现 版 本 也 因 厂 商 的 不 同 而 有 所 差异 。POSIX1003.1c 规 范 的 
发 布 改 变 了 这 一 切 ， 线 程 不 仅 被 很 好 地 标准 化 了 ， 而 且 现 在 绝 大 多 数 
Linux 发 行 版 都 已 支持 它 。 现 在 ， 多 核 处 理 器 即便 对 于 台式 机 也 已 非常 
普遍 ， 大 多 数 机 器 在 底层 硬件 上 就 已 物理 支持 了 同时 执行 多 个 线程 。 而 
人 对 于 单 核 CPU 来 说 ， 线 程 的 同时 执行 只 是 一 个 聪明 、 但 非常 有 效 
JA EE 0 

Linux 系 统 在 1996 年 第 一 次 获得 线程 的 支持 ， 我 们 常 把 当时 使 用 的 
函数 库 称 为 LinuxThread。LinuxThread 已 经 和 POSIX 的 标准 非常 接近 了 
(事实 上 ， 从 许多 方面 来 看 ， 它 们 之 前 的 区 别 并 不 明显 ) ， 它 是 在 
Linux 程 序 设计 中 到 出 的 很 重要 的 一 步 ， 它 使 Linux 程 序 员 第 一 次 可 以 在 
Linux 系 统 中 使 用 线程 。 但 是 ， 在 Linux 的 线程 实现 版 本 和 POSIX 标 准 之 
间 还 是 存在 着 细微 的 差别 ， 最 明显 的 是 关于 信号 处 理 部 分 。 这 些 差别 中 
的 大 部 分 都 受 底层 Linux 内 核 的 限制 ， 而 不 是 函数 库 实现 所 强加 的 。 

许多 项 目 都 在 研究 如 何 才 能 改善 Linux 对 线程 的 支持 ， 这 种 改善 不 
仅仅 是 清除 POSIX 标 准 和 Linux 具 体 实现 之 间 的 细微 的 差别 ， 而 且 要 增 
强 Linux 线 程 的 性 能 和 删除 一 些 不 需要 的 限制 ， 其 中 大 部 分 工作 都 集中 
在 如 何 将 用 户 级 的 线程 映射 到 内 核 级 的 线程 。 在 这 些 项 目 中 有 两 个 主要 
的 项 目 分 别 是 下 一 代 POSIX 线 程 (New Generation POSIX Thread, %5 
为 NGPT) 和 本 地 POSIX 线 程 库 (Native POSIX Thread Library， 人 简写 为 
NPTL) 。 这 两 个 项 目 都 必须 修改 Linux 的 内 核 来 支持 新 的 函数 库 ， 与 旧 


的 Linux 线 程 相 比 ， 两 者 都 极 大 地 提升 了 性 能 。 

2002 年 ，NGPT 项 目 组 宣布 ， 由 于 他 们 不 希望 分 化 线程 团队 ， 所 以 
将 停止 为 NGPT 添 加 新 功能 ， 而 只 是 继续 进行 Linux 上 的 线程 支持 工作 ， 
从 而 有 效 地 将 他 们 的 重担 放 到 了 NPTL 的 身上 。 因 此 ， 很 明显 NPTL 将 成 
为 Linux 线 程 的 新 标准 。 第 一 个 NPTL 的 主流 版 本 出 现在 Red Hat Linux 版 
本 9 上 。 一 些 有 趣 的 关于 NPTL 的 背景 资料 可 以 参考 文章 “Linux 上 的 本 地 
POSIX 线 程 库 ”(The Native POSIX Thread Library for Linux) ， 该 文 的 
作者 是 Ulrich Drepper 和 Ingo Molnar， 在 撰写 本 书 时 ， 该 文 的 下 载 地 址 为 
http://people.redhat.com/drepper/nptl-design.pdf。 

本 间 中 的 大 部 分 代码 适用 于 任何 一 种 线程 库 ， 因 为 这 些 代码 是 基于 
POSIX 标 准 的 ， 而 该 标准 普 裔 适用 于 所 有 的 线程 库 。 但 是 ， 如 果 使 用 的 
是 旧 的 Linux 发 行 版 ， 你 将 看 到 一 些 细微 的 区 别 ， 特 别 是 用 ps 命令 查看 
本 章 示 例 程序 的 运行 情况 时 。 


12.2 线程 的 优点 和 缺点 


在 某 些 环境 下 ， 创 建新 线程 要 比 创建 新 进程 有 更 明显 的 优势 。 新 线 
程 的 创建 代价 要 比 新 进程 小 得 多 (虽然 与 其 他 一 些 操作 系统 相 比 ， 
eee Tecan ee 。 下 面 是 一 些 使 用 线程 的 优 


O 有 时 ， 让 程序 看 起 来 好 像 是 在 同时 做 两 件 事情 是 很 有 用 的 。 一 
个 经 典 的 例子 是 ， 在 编辑 文档 的 同时 对 文档 中 的 单词 个 数 进行 实时 
统计 。 一 个 线程 负责 处 理 用 户 的 输入 并 执行 文本 编辑 工作 ， 男 一 个 
( 它 也 可 以 看 到 相同 的 文档 内 容 ) 则 不 断 刷 新 单词 计数 变量 。 第 一 
个 线程 〈 甚 至 可 以 是 第 三 个 线程 ) 通过 这 个 共享 的 计数 变量 让 用 户 
随时 了 解 上 自己 的 工作 进展 情况 。 男 一 个 例子 是 一 个 多 线程 的 数据 库 
服务 器 ， 这 是 一 种 明显 的 单 进程 服务 多 用 户 的 情况 。 它 会 在 啊 应 一 
些 请 求 的 同时 阻塞 另外 一 些 请 求 ， 使 之 等 竺 磁盘 操作 ， 从 而 改善 整 
体 上 的 数据 吞吐 量 。 对 于 数据 库 服 务 吉 来 说 ， 这 个 明显 的 多 任务 工 
作 如 果 用 多 进程 的 方式 来 完成 将 很 难 做 到 高 效 ， 因 为 各 个 不 同 的 进 
程 必须 紧密 合作 才能 满足 加 锁 和 数据 一 致 性 方面 的 要 求 ， 而 用 多 线 
程 来 完成 就 比 用 多 进程 要 容易 得 多 。 

Oo 一 个 混杂 着 输入 、 计 算 和 输出 的 应 用 程序 ， 可 以 将 这 几 个 部 分 
分 离 为 3 个 线程 来 执行 ， 从 而 改善 程序 执行 的 性 能 。 当 输入 或 输出 
线程 等 待 连接 时 ， 另 外 一 个 线程 可 以 继续 执行 。 因 此 ， 如 果 一 个 进 
程 在 任 一 时 刻 最 多 只 能 做 一 件 事 情 的 话 ， 线 程 可 以 让 它 在 等 待 连接 
之 类 的 事情 的 同时 做 一 些 其 他 有 用 的 事情 。 一 个 需要 同时 人 处理 多 个 
UU -个 天 生 适 用 于 应 用 多 线程 的 例 
口 一 般 而 言 ， 线 程 之 间 的 切换 需要 操作 系统 做 的 工作 要 比 进程 之 
间 的 切换 少 得 多 ， 因 此 多 个 线程 对 资源 的 需求 要 远 小 于 多 个 进程 。 
如 果 一 个 程序 在 逻辑 上 需要 有 多 个 执行 线程 ， 那 么 在 单 处 理 器 系统 
上 把 它 运 行为 一 个 多 线程 程序 才 更 符合 实际 情况 。 虽 然 如 此 ， 编 写 
一 个 多 线程 程序 的 设计 困难 较 大 ， 不 应 等 闲 视 之 。 

线程 也 有 下 面 一 些 缺 点 。 

O 编写 多 线程 程序 需要 非常 仔细 的 设计 。 在 多 线程 程序 中 ， 因 时 
序 上 的 细微 偏差 或 无 意 造 成 的 变量 共享 而 引发 错误 的 可 能 性 是 很 大 
的 。Alan Cox (Linux 方 面 的 权威 ， 他 撰写 了 本 书 的 序 ) 曾经 评论 
线程 为 “如 何 立 刻 让 自己 自 讨 苦 吃 。” 

O 对 多 线程 程序 的 调试 要 比 对 单线 程 程序 的 调试 困难 得 多 ， 因 为 


线程 之 间 的 交互 非常 难于 控制 。 

O 将 大 量 计 算 分 成 两 个 部 分 ， 并 把 这 两 个 部 分 作为 两 个 不 同 的 线 
程 来 运行 的 程序 在 一 台 单 处 理 占 机 右上 并 不 一 定 运 行 得 更 快 ， 除 非 
计算 确实 允许 它 的 不 同 部 分 可 以 被 同时 计算 ， 而 且 运 行 它 的 机 器 拥 
有 多 个 处 理 器 核 来 文 持 真 正 的 多 处 理 。 


12.3 ”第 一 个 线程 程 月 


ee, 


线程 有 一 套 完 整 的 与 其 有 关 的 函数 库 调 用 ， 它 们 中 的 绝 大 多 数 函 数 
名 都 以 pthread_ 开头 。 为 了 使 用 这 些 函 数 库 调 用 ， 我 们 必须 定义 宏 
_REENTRANT， 在 程序 中 包含 头 文件 pthread.h， 并 且 在 编译 程序 时 需要 
用 选项 -1pthread 来 链接 线程 库 。 

在 设计 最 初 的 UNIX 和 POSIX 库 例 程 时 ， 人 们 假设 每 个 进程 中 只 有 
一 个 执行 线程 。 一 个 明显 的 例子 就 是 errno， 该 变量 用 于 获取 某 个 函数 调 
用 失败 后 的 错误 信息 。 在 一 个 多 线程 程序 里 ， 默 认 情 况 下 ， 只 有 一 个 
errno 变 量 供 所 有 的 线程 共享 。 在 一 个 线程 准备 获取 刚才 的 错误 代码 时 ， 
该 变量 很 容易 被 另 一 个 线程 中 的 函数 调用 所 改变 。 类 似 的 问题 还 存在 于 
fputs 之 类 的 函数 中 ， 这 些 函数 通常 用 一 个 全 局 性 区 域 来 缓存 输出 数据 。 

为 解决 这 个 问题 ， 我 们 需要 使 用 被 称 为 可 重 入 的 例 程 。 可 重 入 代码 
可 以 被 多 次 调用 而 仍然 正常 工作 ， 这 些 调用 可 以 来 自 不 同 的 线程 ， 也 可 
以 是 某 种 形式 的 咀 套 调用 。 因 此 ， 代 码 中 的 可 重 入 部 分 通常 只 使 用 局 部 
en ee a 


编写 多 线程 程序 时 ， 我 们 通过 定义 宏 _REENTRANT 来 告诉 编译 器 
我 们 需要 可 重 入 功能 ， 这 个 宏 的 定义 必须 位 于 程序 中 的 任何 巩 nclude 语 
句 之 前 。 它 将 为 我 们 做 3 件 事 情 ， 并 且 做 得 非常 优雅 ， 以 至 于 我 们 一 般 
不 需要 知道 它 到 底 做 了 哪些 事 。 

口 ” 它 会 对 部 分 函数 重新 定义 它们 的 可 安全 重 入 的 版 本 ， 这 些 函 数 

的 名 字 一 般 不 会 发 生 改 变 ， 只 是 会 在 函数 名 后 面 添加 I 字符 串 。 例 

如 ， 函 数 名 gethostbyname 将 变 为 gethostbyname_r。 

口 原来 以 宏 的 形式 实现 的 一 些 函 数 将 变 成 可 安全 重 入 的 

函数 。 

O “在 errmno.h 中 定义 的 变量 ermno 现 在 将 成 为 一 个 函数 调用 ， 它 能 够 

以 一 种 多 线程 安全 的 方式 来 获取 真正 的 errno 值 。 

在 程序 中 包含 头 文 件 pthread.h 还 将 回 我 们 提供 一 些 其 他 的 将 在 代码 
中 使 用 到 的 定义 和 函数 原型 ， 就 如 同 头 文件 stdio.h 为 标准 输入 和 标准 输 
出 例 程 所 提供 的 定义 一 样 。 最 后 ， 需 要 确保 在 程序 中 包含 了 正确 的 线程 
头 文 件 ， 并 且 在 编译 程序 时 链接 了 实现 pthread 函 数 的 正确 的 线程 库 。 有 
关 编 译 线程 程序 的 更 详细 的 情况 将 在 下 面 的 实验 部 分 中 再 介绍 。 现 在 ， 
我 们 首先 来 看 一 个 用 于 管理 线程 的 新 函数 pthread_create， 它 的 作用 是 创 
建 一 个 新 线程 ， 类 似 于 创建 新 进程 的 fork 函 数 。 它 的 定义 如 下 所 示 : 


#include <pthread.h> 


int pthread_create(pthread_t *thread, pthread_attr_t *attr, void 
*(*start_ routine) (void *), void *arg); 


这 个 函数 定义 看 起 来 很 复杂 ， 其 实用 起 来 很 简单 。 第 一 个 参数 是 指 
器 pthread_t 类 型 数据 的 指针 。 线 程 被 创建 时 ， 这 个 指针 指向 的 变量 中 将 
被 写 入 一 个 标识 符 ， 我 们 用 该 标识 符 来 引用 新 线程 。 下 一 个 参数 用 于 设 
置 线程 的 属性 。 我 们 一 般 不 需要 特殊 的 属性 ， 所 以 只 需 设 置 该 参数 为 
NULL。 我 们 将 在 本 章 的 后 面 介绍 如 何 使 用 这 些 属性 。 最 后 两 个 参数 分 
别 告 诉 线程 将 要 局 动 执 行 的 函数 和 传递 给 该 函数 的 参数 。 


void *(*start routine) (void *) 


上 面 一 行 告诉 我 们 必须 要 传递 一 个 函数 地 址 ， 该 函数 以 一 个 指 问 
void 的 指针 为 参数 ， 返 回 的 也 是 一 个 指向 void 的 指针 。 因 此 ， 可 以 传递 
一 个 任 一 类 型 的 参数 并 返回 一 个 任 一 类 型 的 指针 。 用 fork 调 用 后 ， 父 子 
进程 将 在 同一 位 置 继续 执行 下 去 ， 只 是 fork 调 用 的 返回 值 是 不 同 的 ;但 
对 新 线程 来 说 ， 我 们 必须 明确 地 提供 给 它 一 个 函数 指针 ， 新 线程 将 在 这 
个 新 位 置 开 始 执行 。 

该 函数 调用 成 功 时 返回 值 是 0， 如 有 果 失 败 则 返回 错误 代码 。 手 册页 
和 
BH 。 


pthread_create 和 大 多 数 pthread_ 系 列 函数 一 样 ， 在 失败 时 并 未 
遵循 UNIX 函 数 的 惯例 返回 -1， 这 种 情况 在 UNIX 函 数 中 属于 一 少 部 
分 。 所 以 除非 你 很 有 把 握 ， 在 对 错误 代码 进行 检查 之 前 一 定 要 仔细 
阅读 使 用 手册 中 的 有 关内 容 。 


线程 通过 调用 pthread_exit 函 数 终止 执行 ， 束 如 同 进 程 在 结束 时 调用 
exit 函 数 一 样 。 这 个 函数 的 作用 是 ， 终 止 调用 它 的 线程 并 返回 一 个 指向 
某 个 对 象 的 指针 。 注 意 ， 绝 不 能 用 它 来 返回 一 个 指向 局 部 变量 的 指针 ， 
因为 线程 调用 该 函数 后 ， 这 个 局 部 变量 就 不 再 存在 了 ， 这 将 引起 严重 的 
程序 漏洞 。pthread_exit 函 数 的 定义 如 下 所 示 : 


#include <pthread.h> 


void pthread_exit(void *retval); 


pthread_ join 函数 在 线程 中 的 作用 等 价 于 进程 中 用 来 收集 子 进程 信息 
的 wait 函 数 。 这 个 函数 的 定义 如 下 所 示 : 


#include <pthread.h> 


int pthread_join(pthread_t th, void **thread_return); 


第 一 个 参数 指定 了 将 要 等 待 的 线程 ， 线 程 通 过 pthread_create 返 回 的 
标识 符 来 指定 。 第 二 个 参数 是 一 个 指针 ， 它 指 同 男 一 个 指针 ， 而 后 者 指 
同 线 程 的 返回 值 。 与 pthread_create 类 似 ， 这 个 函数 在 成 功 时 返回 9， 失 
败 时 返回 错误 代码 。 


实 验 一 个 简单 的 线程 程序 

这 个 程序 创建 一 个 新 线程 ， 新 线程 与 原先 的 线程 共享 变量 ， 并 在 结 
束 时 间 原 先 的 线程 返回 一 个 结果 。 没 有 比 这 更 简单 的 多 线程 程序 了 ! 下 
面 是 程序 thread1.c 的 代码 : 


#in 


#in unistd. h> 
finclude <stdlib.h> 
a de <string.h> 
$ 


i *thread_function(void arg); 


C1) 编译 这 个 程序 时 ， 我 们 首先 需要 定义 宏 REENTRANT。 在 少 
数 系 统 上 ， 可 能 还 需要 定义 宏 POSIX_C_SOURCE， 但 一 般 不 需要 定义 
s> 
K 


(2) 接 下 来 必须 链接 正确 的 线程 库 。 如 果 使 用 的 是 一 个 老 的 Linux 
发 行 版 ， 默 认 的 线程 库 不 是 NPTL， 你 可 能 需要 升级 Linux 发 行 版 ， 尽 管 


本 章 中 的 大 多 数 代 码 也 兼容 老 的 Linux 线 程 实 现 。 简 单 的 检查 方法 是 查 
看 头 文件 srvinclude/pthread.h。 如 果 这 个 文件 中 显示 的 版 权 日 期 是 2003 
年 或 更 晚 ， 那 几乎 可 以 肯定 你 的 Linux 发 行 版 使 用 的 是 NPTL 实 现 。 如 果 
日 期 比 这 个 早 ， 你 可 能 就 需要 安装 一 个 较 新 版 本 的 Linux T - 

(3) 在 验证 并 安装 了 正确 的 文件 后 ， 现 在 可 以 编译 和 链接 这 个 程 
序 了 ， 使 用 的 命令 如 下 所 示 : 


> CC ~D_REENTRANT -I/usr/include/nptl threadl.c 
-0 threadl -L/usr/lib/nptl -lpthread 


MRR BARR EA RAAE) 现 是 NPIL 线 程 库 ， 那 
么 编译 程序 时 就 无 需 加 上 -I 和 -L 选 项 。 使 用 的 命令 如 下 所 示 : 


$ cc -D_REENTRANT threadl.c -o threadi -lpthread 
我 们 将 在 本 章 中 一 直 使 用 这 一 简单 版 本 的 命令 行 。 


(4) 运行 这 个 程序 时 ， 你 将 看 到 : 
$ ./threadi 
Waiting for thread to finish.. 
thread_function is running. Argument was Hello World 


Thread joined, it returned Thank you for the CPU time 
Message is now Bye! 

这 个 程序 值得 我 们 花 一 点 时 间 去 理解 ， 因 为 它 是 本 章 中 大 多 数 例 子 
的 基础 。 

实验 解析 

首先 ， 我 们 定义 了 在 创建 线程 时 需要 由 它 调 用 的 一 个 函数 的 原型 。 
如 下 所 示 : 
void *thread_function(void *arg); 

根据 pthread_create 的 要 求 ， 它 只 有 一 个 指 同 void 的 指针 作为 参数 ， 
返回 的 也 是 指 同 void 的 指针 。 稍 后 ， 我 们 将 介绍 这 个 函数 的 实现 。 

在 main 函 数 中 ， 我 们 首先 定义 了 几 个 变量 ， 然 后 调用 pthread_create 
开始 运行 新 线程 。 如 下 所 示 : 


我 们 向 pthread_create 函 数 传递 了 一 个 pthread_t 类 型 对 象 的 地 址 ， 今 


后 可 以 用 它 来 引用 这 个 新 线程 。 我 们 不 想 改 变 默 认 的 线程 属性 ， 所 以 设 
置 第 二 个 参数 为 NULL。 最 后 两 个 参数 分 别 为 将 要 调用 的 函数 和 一 个 传 
递 给 该 函数 的 参数 。 

如 果 这 个 调用 成 功 了 ， 就 会 有 两 个 线程 在 运行 。 原 先 的 线程 

(main) 继续 执行 pthread_create 后 面 的 代码 ， 而 新 线程 开始 执行 

thread_functione& 2 . 

原先 的 线程 在 查 明 新 线程 已 经 启动 后 ， 将 调用 pthread_join 函 数 ， 如 
下 所 示 : 


res = pthread_join(a_thread, &thread_result) ; 


我 们 给 该 函数 传递 两 个 参数 ， 一 个 是 正在 等 待 其 结束 的 线程 的 标识 
符 ， 男 一 个 是 指 同 线程 返回 值 的 指针 。 这 个 函数 将 等 到 它 所 指定 的 线程 
终止 后 才 返 回 。 然 后 主线 程 将 打印 新 线程 的 返回 值 和 全 局 变量 message 
的 值 ， 最 后 退出 。 

新 线程 在 thread_function 函 数 中 开始 执行 ， 它 先 打 印 出 上 自己 的 参 
数 ， 体 眼 一 会 儿 ， 然 后 更 新 全 局 变量 ， 最 后 退出 并 回 主 线程 返回 一 个 字 
符 串 。 新 线程 修改 了 数组 message， 而 原先 的 线程 也 可 以 访问 该 数组 。 
如 果 我 们 调用 的 是 fork 而 不 是 pthread_create， 就 不 会 有 这 样 的 效果 。 


12.4 ”同时 执行 


接 下 来 ， 我 们 将 编写 一 个 程序 来 验证 两 个 线程 的 执行 是 同时 进行 的 
(当然 ， 如 果 是 在 一 个 单 处 理 器 系统 上 ， 线 程 的 同时 执行 整 需 要 靠 CPU 
在 线程 之 间 的 快速 切换 来 实现 ) 。 因 为 还 未 介绍 到 任何 可 以 帮助 我 们 有 
效 地 完成 这 一 工作 的 线程 同步 函数 ， 在 这 个 程序 中 我 们 是 在 两 个 线程 之 
间 使 用 轮 询 搁 术 ， 所 以 它 的 效率 很 低 。 同 时 ， 我 们 的 程序 仍然 要 利用 这 
一 事实 ， 即 除 局 部 变量 外 ， 所 有 其 他 变量 都 将 在 一 个 进程 中 的 所 有 线程 
之 间 共 享 。 


实 验 两 个 线程 同时 执行 

在 本 节 中 ， 我 们 创建 的 程序 thread2.c 是 在 对 thread1.c 稍 加 修改 的 基 
础 上 编写 出 来 的 。 我 们 增加 了 男 外 一 个 文件 范围 变量 来 测试 哪个 线程 正 
在 运行 。 如 下 所 示 : 


程序 的 完整 代码 可 以 在 本 书 的 网 站 上 下 载 。 


Int run now = 1: 


or pk acy fron nowt Al, EAT REN 
Ww 2 
eas I 我 们 在 创建 新 线程 的 语句 之 后 添加 下 面 的 代码 : 


如 果 run_now 的 值 为 1， 残 打印 “1” 并 设置 它 为 2， 合 则 ， 就 稍 做 休 明 
然后 再 检查 它 的 值 。 我 们 不 断 地 检查 来 等 待 它 的 值 变 为 1， 这 种 方式 被 
称 为 忙 等 待 ， 昌 然 已 经 在 两 次 检查 之 间 休 忍 1 秒 钟 来 减 慢 检查 的 频率 
了 。 在 本 章 的 后 面 我 们 将 看 到 对 这 一 问题 的 一 个 更 好 的 解决 方法 。 

在 新 线程 执行 的 thread_function 函 数 中 ， 我 们 所 做 的 事情 和 上 面 的 
大 部 分 都 相同 ， 只 是 把 run_now 的 值 颠倒 了 一 下 。 如 下 所 示 : 


我 们 还 删除 了 参数 的 传递 和 返回 值 的 传递 ， 因 为 现在 我 们 不 再 需要 
EATS 
运行 这 个 程序 时 ， 将 看 到 如 下 所 示 的 输出 结 来 (你 可 能 会 及 现 程 序 
要 过 几 秒 钟 才 会 产生 输出 ， 特 别 是 在 一 个 单 核 CPU 的 机 器 上 ) 。 
$ cc -D_REENTRANT thread2.c -o thread2 -lpthread 
$ ./thread2 
12121212121212£21212 
Waiting for thread to finish... 
rh 


m 


read joined 

实验 解析 

每 个 线程 通过 设置 rnn_now 变 量 的 方法 来 通知 另 一 个 线程 开始 运 
行 ， 然 后 ， 它 会 等 待 男 一 个 线程 改变 了 这 个 变量 的 值 后 再 次 运行 。 这 个 
例子 显示 了 两 个 线程 之 间 自 动 交 蔡 执 行 ， 同 时 也 再 次 阐明 了 一 个 观点 ， 
即 这 两 个 线程 共享 rnn_now 变 量 。 


12.5 步 


在 上 一 节 中 ， 我 们 看 到 两 个 线程 同时 执行 的 情况 ， 但 我 们 采用 的 在 
它们 之 间 进 行 切 换 的 方法 是 非常 笨拙 旦 没有 效率 的 。 斑 运 的 是 ， 专 门 有 
eal 的 函数 为 我 们 提供 了 更 好 的 控制 线程 执行 和 访问 代码 临界 区 
或 的 方法 。 

我 们 将 在 本 节 学 习 两 种 基本 的 方法 。 一 种 是 信号 量 ， 它 的 作用 如 同 
看 守 一 段 代 码 的 看 门人 ; 另 一 种 是 互 斥 量 ， 它 的 作用 如 同 保护 代码 段 的 
一 个 互 斥 设备 。 这 两 种 方法 很 相似 ， 事 实 上 ， 它 们 可 以 互相 通过 对 方 来 
实现 。 但 在 实际 应 用 中 ， 对 于 一 些 情况 ， 可 能 使 用 信号 量 或 互 斥 量 中 的 
一 个 更 符合 问题 的 语义 ， 并 且 效 果 更 好 。 人 例如， 如果 想 控制 任 一 时 刻 只 


能 有 一 个 线程 可 以 访问 一 些 共 孚 和 内存， 使 用 互 斥 量 就 要 目 然 得 多 。 但 在 
控制 对 一 组 相同 对 象 的 访问 时 一 一 比如 从 5 条 可 用 的 电话 线 中 分 配 1 条 给 
某 个 线程 的 情况 ， 就 更 运 合 使 用 计数 信号 量 。 有 具体 选择 哪 种 方法 取决 于 
个 人 偏好 和 相应 的 程序 机 制 。 


有 两 组 接口 函数 用 于 信号 量 。 一 组 取 目 POSIX 的 实时 扩展 ， 用 于 线 
程 。 力 一 组 被 称 为 系统 V 信 号 量 ， 常 用 于 进程 的 同步 (我 们 将 在 第 14 章 
介绍 第 二 组 接口 函数 ) 。 这 两 组 接口 函数 虽然 很 相近 ， 但 并 不 保证 它们 
之 间 可 以 互 换 ， 而 且 它 们 使 用 的 函数 调用 也 各 不 相同 。 

fh = SLA Dijkstra chet Sa Ss. fa Be 
个 特殊 类 型 的 变量 ， 它 可 以 被 增加 或 减少 ， 但 对 其 的 关键 访问 被 保证 是 
原子 操作 ， 即 使 在 一 个 多 线程 程序 中 也 是 如 此 。 这 意味 着 如 果 一 个 程序 
中 有 两 个 (或 更 多 ) 的 线程 试图 改变 一 个 信和 号 量 的 值 ， 系 统 将 保证 所 有 
的 操作 都 将 依次 进行 。 但 如 果 是 普通 变量 ， 来 自 同一 程序 中 的 不 同 线程 
的 冲突 操作 所 导致 的 结果 将 是 不 确定 的 。 

在 本 市 中 ， 我 们 将 介绍 一 种 最 简单 的 信号 量 一 一 二 进 制 信号 量 ， 它 
只 有 0 和 1 两 种 取 值 。 还 有 一 种 更 通用 的 信号 量 一 一 计数 信号 量 ， 它 可 以 
有 更 大 的 取 值 范围 。 信 号 量 一 般 常 用 来 保护 一 段 代 码 ， 使 其 每 次 只 能 家 
一 个 执行 线程 运行 ， 要 完成 这 个 工作 ， 就 要 使 用 二 进 制 信号 量 。 有 时 ， 
我 们 硕 望 可 以 允许 有 限 数目 的 线程 执行 一 段 指定 的 代码 ， 这 就 需要 用 到 
计数 信号 量 。 由 于 计数 信号 量 并 不 利用， 所 以 我 们 在 这 里 不 对 它 进 行 深 
入 的 介绍 ， 实 际 上 它 仪 仅 是 二 进 制 信号 量 的 一 种 逻辑 扩展 ， 两 者 实际 调 
用 的 函数 都 一 样 。 


fa S PRB FE sem FK, MARKS BAA R BLAME A 
vga 线程 中 使 用 的 基本 信和 号 量 函 数 有 4 个 ， 它 们 都 非常 的 简 


”信号 量 通过 sem_init 函 数 创建 ， 它 的 定义 如 下 所 示 : 


#include <semaphore.h> 


int sem init(sem t *sem, int pshared, unsigned int value); 

这 个 函数 初始 化 由 sem 指 向 的 信号 量 对 象 ， 设 置 它 的 共享 选项 〈 我 
们 马上 就 会 介绍 到 它 ) ， 并 给 它 一 个 初始 的 整数 值 。pshared 参 数控 制 信 
号 量 的 类 型 ， 如 有 果 其 值 为 0， 就 表示 这 个 信号 量 是 当前 进程 的 局 部 信和 号 
量 ， 人 否则 ， 这 个 信号 量 惑 可 以 在 多 个 进程 之 间 共 胖 。 我 们 在 这 里 只 对 不 
能 在 进程 间 共 享 的 信号 量 感 兴 趣 。 在 编写 本 书 时 ，Linux 还 不 文 持 这 种 
共 圣 ， 给 pshared 参 数 传递 一 个 非 零 值 将 导致 调用 失败 。 

接 下 来 的 两 个 函数 控制 信号 量 的 值 ， 它 们 的 定义 如 下 所 示 : 

#include <semaphore.h> 


int sem wait(sem t * sem); 


int sem post(sem t * sem); 


这 两 个 函数 都 以 一 个 指针 为 参数 ， 该 指针 指 癌 的 对 象 是 由 sem_init 
调用 初始 化 的 信号 量 。 

sem_post 函 数 的 作用 是 以 原子 操作 的 方式 给 信和 号 量 的 值 加 1。 所 谓 
原子 操作 是 指 ， 如 果 两 个 线程 企图 同时 给 一 个 信号 量 加 1， 它 们 之 间 不 
会 互相 和 干扰， 而 不 像 如 果 两 个 程序 同时 对 同一 个 文件 进行 读 取 、 增 加 、 
写 入 操作 时 可 能 会 引起 冲突 。 信 号 量 的 值 总 是 会 补正 确 地 加 2， 因 为 有 
两 个 线程 试图 改变 它 。 

sem_wait 沙 数 以 原子 操作 的 方式 将 信号 量 的 值 减 1， 但 它 会 等 待 直 
到 信号 量 有 个 非 零 值 才 会 开始 减法 操作 。 因 此 ， 如 果 对 值 为 2 的 信号 量 
调用 sem_wait， 线 程 将 继续 执行 ， 但 信号 量 的 值 会 减 到 1。 如 果 对 值 为 0 
的 信号 量 调用 sem_wait， 这 个 函数 就 会 等 待 ， 直 到 有 其 他 线程 增加 了 该 
信号 量 的 值 使 其 不 再 是 0 为 止 。 如 末 两 个 线程 同时 在 sem_wait 调 用 上 等 
竺 同一 个 信号 量变 为 非 零 值 ， 那 么 当 该 信号 量 被 第 三 个 线程 增加 1 时 ， 
只 有 其 中 一 个 等 竺 线程 将 开始 对 信号 量 减 1， 然 后 继续 执行 ， 另 外 一 个 
线程 还 将 继续 等 待 。 信 和 号 量 的 这 种 “在 单个 函数 中 就 能 原子 化 地 进行 测 
试 和 设置 ”的 能 力 使 其 变 得 非常 有 价值 。 


还 有 另外 一 个 信号 量 函 数 sem_trywait， 它 是 sem_wait 的 非 阻塞 
版 本 。 我 们 不 在 这 里 对 它 做 更 多 的 介绍 ， 更 详细 的 资料 可 以 参考 它 
的 手册 页 。 


最 后 一 个 信号 量 函 数 是 sem_destroy。 这 个 函数 的 作用 是 ， 用 完 信和 号 
量 后 对 它 进行 清理 。 它 的 定义 如 下 : 
#include <semaphore.h> 


int sem destroy(sem t * sem); 

与 前 几 个 函数 一 样 ， 这 个 函数 也 以 一 个 信号 量 指 针 为 参数 ， 并 清理 
该 信号 量 拥 有 的 所 有 资源 。 如 果 企 图 清理 的 信号 量 正 被 一 些 线程 等 待 ， 
就 会 收 到 一 个 错误 。 l 
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实 验 一 个 线程 信号 量 ein 
这 个 程序 thread3.c 也 是 基于 threadl.c 的 。 因 为 改动 的 地 方 比 较 多 ， 
所 以 我 们 将 其 完整 代码 列 在 下 面 。 


#include <stdio.h> 
#include <unistd.h> 
#include <stdlib.h> 
#include <string.h> 
#include <pthread.h> 
finclude <semaphore.h> 


void *thread_function(void *arg}; 
sem_t bin_sem; 


#define WORK_SIZE 1024 
char work_area[WORK_SIZE]}; 


int main() { 
int res; 
pthread_t a_thread; 
void *thread_result; 


res = sem_init(&bin_sem, 0, 0); 
if (res != 0) { 
perror("Semaphore initialization failed"); 


exit (EXIT_FAILURE) ; 


res = pthread_create(aa_thread, NULL, thread_function, NULL); 
if (res t= 0) { 

perror(*Thread creation failed"); 

exit (EXIT_FAILURE); 


printf(*Input some text. Enter ‘end’ to finish\n"); 


while (strnemp("end*, work_area, 3) != 0) 1 
gets (w + WORK_SIZE, s 
empo em) 
printf("\nWaiting r ead t inis \n 
res pthread_join(a_thread, &th d_result 
{res != 0 
perror("Thread jo eå") 
exit (EXIT_FAILURE 


printf ("Thread jc 
sem destroy (&bin 
exit (EXIT SUCCESS) ; 


void *thread_function(void *arg) | 
sem_wait (&bin_sem); 
while(strnemp(*end*, work_area, | 
printf(*You input $d characters\n’, strlen(work_area) -1 
sem_wait(&bin_sem); 


第 一 个 重要 的 改动 是 包含 了 头 文件 semaphore.h， 它 使 我 们 可 以 访问 
信号 量 函 数 。 然 后 ， 定 义 一 个 信号 量 和 几 个 变量 ， 并 在 创建 新 线程 之 前 
对 信号 量 进行 初始 化 。 如 下 所 示 : 


sem_t bin_sem; 


#define WORK_SIZE 1024 
char work_area[WORK_SIZE]; 


int main() { 

int res; 

pthread_t a_thread; 

void *thread_result; 

res = sem_init(&bin_sem, 0, 0}; 

if (res != 0) { 
perror ("Semaphore initialization failed"); 
exit (EXIT_FAILURE) ; 


} 
注意 ， 我 们 将 这 个 信号 量 的 初始 值 设置 为 0。 
在 main 函 数 中 ， 局 动 新 线程 后 ， 我 们 从 键盘 读 取 一 些 文本 并 把 它们 
放 到 工作 区 work_area 数 组 中 ， 然 后 调用 sem_post 增 加 信号 量 的 值 。 如 下 


所 示 : 


printr ("input some text. Enter ‘end to rinisn\n"); 


sha ls ~ ju t BEA i> ~y Yr 
while(strncemp("end", work_area, 3 
Bo es i EON jee 
rgets(work_area, WORK_SIZE, stdi 


sem_post(&bin_sem) ; 


aE E E E E AR ee E 
下 所 示 : 


e(strncmm("end", work_area, 


xO Nn SEM) ; 


设置 信号 量 的 同时 ， 我 们 等 待 着 键盘 的 输入 。 当 输入 到 达 时 ， 我 们 
释放 信号 量 ， 人 允许 第 二 个 线程 在 第 一 个 线程 再 次 读 取 键盘 输入 之 前 统计 
出 输入 字符 的 个 数 。 

这 两 个 线程 共享 同一 个 work_area 数 组 。 为 了 让 示例 代码 更 加 简洁 
并 容易 理解 ， 我 们 还 省 略 了 一 些 错误 检查 。 例 如 ， 没 有 检查 sem_wait 函 
数 的 返回 值 。 但 在 产品 代码 中 ， 除 非 有 特别 充足 的 理由 才 省 略 错误 检 
查 ， 和 否则 我 们 总 是 应 该 检查 函数 的 返回 值 。 
运行 这 个 程序 : 
cc -D_REENTRANT thread3.c -o thread3 -lpthread 
./thread3 


some text. Enter ‘ena’ 


Waiting for thread to finish 


在 线程 程序 中 ， 时 序 错误 碍 找 起 来 总 是 特别 困难 ， 但 这 个 程序 似乎 
对 快速 的 文本 输入 和 悠 内 的 暂 集 都 很 适应 。 

实验 解析 

初始 化 信号 量 时 ， 我 们 把 它 的 值 设 置 为 0。 这 样 ， 在 线程 冰 数 局 动 
时 ，sem_wait 函 数 调 用 就 会 阻 玲 并 等 得 信号 量变 为 非 零 值 。 

在 主线 程 中 ， 我 们 等 竺 下 到 有 文本 输入 ， 然 后 调用 sem_post 增 加 信 
号 量 的 值 ， 这 将 立刻 令 另 一 个 线程 从 sem_wait 的 等 竺 中 返回 并 开始 执 
行 。 在 统计 完 字符 个 数 之 后 ， 它 再 次 调用 sem_wait 并 再 次 被 阻 赛 ， 直 到 
主线 程 再 次 调用 sem_post 增 加 信和 号 量 的 值 为 止 。 

我 们 很 容易 忽略 程序 设计 上 的 细微 错误 ， 而 该 错误 会 导致 程序 运行 
结 末 中 的 一 些 细微 错误 。 我 们 将 上 面 的 程序 稍 加 修改 并 另存 为 


thread3a.co ERRER KR A Bese AAT A A SP HE 28 I I SCAB A a ER 
To I ST RSC EE: 


xt. En 
mp ( "end" ear area, 3 = ( 
} rea *PAST*, 4 


ost (&bin_sem) ; 


sem_po 


现在 ， 如 果 输 入 FAST， 程 序 就 会 调用 sem_post 使 字符 统计 线程 开 
台 运 行 ， 同 时 立刻 用 其 他 数据 更 新 work_area 数 组 。 程 序 运 行情 况 如 下 
所 示 : 


> cc -D REENTRANT thread3a.c -O thread3a -iptnreada 
$ ./thread3a 
Input some text. Enter ‘end' to finish 


问题 在 于 ， 我 们 的 程序 依赖 其 接收 文本 输入 的 时 间 要 足够 长 ， 这 样 
为 一 个 线程 才 有 时 间 在 主线 程 还 未 准备 好 给 它 更 多 的 单词 去 统计 之 前 统 
计 出 工作 区 中 字符 的 个 数 。 当 我 们 试图 连续 快速 地 给 它 两 组 不 同 的 单词 
去 统计 时 〔〈 键 盘 输 入 的 FAST 和 程序 自动 提供 的 Weeee...) ， 第 二 个 线程 
就 没有 时 间 去 执行 。 但 信号 量 已 被 增加 了 不 止 一 次 ， 所 以 字符 统计 线程 
束 会 有 反复 统计 字符 数目 并 减少 信号 量 的 值 ， 直 到 它 再 次 变 为 0 为 止 。 

这 个 例子 显示 : 在 多 线程 程序 中 ， 我 们 需要 对 时 序 考虑 得 非常 仔 
细 。 为 了 解决 上 面 程序 中 的 问题 ， 我 们 可 以 再 增加 一 个 信号 量 ， 让 主线 
程 等 到 统计 线程 完成 字符 个 数 的 统计 后 再 继续 执行 ， 但 更 简单 的 一 种 方 
式 是 使 用 互 斥 量 。 


12.5.2 互 奈 量 进行 同步 


为 一 种 用 在 多 线程 程序 中 的 同步 访问 方法 是 使 用 互 斥 量 。 它 允许 程 
序 员 锁 住 菏 个 对 象 ， 使 得 每 次 只 能 有 一 个 线程 访问 它 。 为 了 控制 对 关键 
代码 的 访问 ， 必 须 在 进入 这 段 代码 之 前 锁 住 一 个 互 斥 量 ， 然 后 在 完成 操 
作 之 后 解锁 它 。 


用 于 互 斥 量 的 基本 函数 和 用 于 信号 量 的 函数 非常 相似 ， 它 们 的 定义 
如 下 所 示 : 


#include <pthread.n> 


int pthread_mutex_init(pthread mutex t *mutex, const pthread_mutexattr_t 
*mutexattr); 


int pthread mutex _lock(pthread_mutex_t *mutex)); 
int pthread_mutex_unlock(pthread_mutex_t *mutex); 


与 其 他 函数 一 样 ， 成 功 时 返回 0， 失 败 时 将 返回 错误 代码 ， 但 这 些 
函数 并 不 设置 errmno， 你 必须 对 函数 的 返回 代码 进行 检查 。 

与 信号 量 类 似 ， 这 些 函 数 的 参数 都 是 一 个 先前 声明 过 的 对 象 的 指 
针 。 对 互 斥 量 来 说 ， 这 个 对 象 的 类 型 为 pthread_mnutex_t。 
pthread_mnutex_init 函 数 中 的 属性 参数 允许 我 们 设置 互 斥 量 的 属性 ， 而 属 
性 控制 着 互 斥 量 的 行为 。 属 性 类 型 默认 为 fast， 但 它 有 一 个 小 缺点 : 如 
采 程 序 试图 对 一 个 己 经 加 了 锁 的 互 斥 量 调用 pthread_mutex_lock， 程 序 
束 会 被 阻塞 ， 而 又 因为 拥有 互 斥 量 的 这 个 线程 正 是 现在 被 阻塞 的 线程 ， 
所 以 互 斥 量 就 永远 也 不 会 被 解 氏 了， 程序 也 就 进入 死 锁 状 态 。 这 个 问题 
可 以 通过 改变 互 斥 量 的 属性 来 解雇 ， 我 们 可 以 让 它 检查 这 种 情况 并 返回 
一 个 错误 ， 或 者 让 它 递 归 的 操作 ， 给 同一 个 线程 加 上 多 个 锁 ， 但 必须 注 
意 在 后 面 执 行 同等 数量 的 解锁 操作 。 

设置 互 斥 量 的 属性 超出 了 本 书 的 讨论 范围 ， 所 以 我 们 将 传递 NULL 
给 属性 指针 ， 从 而 使 用 其 默认 行为 。 与 改变 属性 相关 的 更 详细 的 资料 可 
以 参考 pthread_mutex_init 的 手册 页 。 


K 验 线程 互 斥 量 

这 个 程序 也 基于 原先 的 threadl.c， 但 改动 的 地 方 比 较 多 。 这 次 ， 假 
设 需要 保护 对 一 些 关 键 变 量 的 访问 ， 我 们 用 一 个 互 斥 量 来 保证 任 一 时 刻 
只 能 有 一 个 线程 访问 和 它们。 为 了 让 示例 代码 容易 阅读 ， 我 们 省 略 了 对 互 
斥 量 加 锁 和 解锁 调用 的 返回 值 应 该 进行 的 一 些 错误 检查 。 在 软件 代码 
中 ， 对 返回 值 的 检查 是 必 不 可 少 的。 下 面 是 新 程序 thread4.c 的 代码 : 


#include <stdio.h> 
finclude <unistd.h> 
include <stdlib.h> 
#include <string.h> 
finclude <pthread.h> 
finclude <semaphore.h> 


void *thread_function(void *arg); 
pthread_mutex_t work_mutex; /* protects both work_area and time_to_exit */ 


tdefine WORK_SIZE 1024 
char work_area[WORK_SIZE] ; 
int time_to_exit = 0; 


int main() { 
int res; 
pthread_t a_thread; 
void *thread_result; 
res = pthread_mutex_init (4work_smutex, NULL); 
if (res 1= 0) { 
perror("Mutex initialization failed*); 
exit (EXIT_FAILURE); 
) 
res = pthread_create(&a_thread, NULL, thread_function, NULL}; 
if (res t= 0) { 
perror(*Thread creation failed"); 
exit (EXIT_FAILURE) ; 
} 
pthread_mutex_lock(&work_ mutex); 
Pprintf ("Input some text. Enter ‘end’ to finish\n‘); 
while(!time_to_exit) ( 
fgets(work_area, WORK_SIZE, stdin); 
prhread_mutex_unlock({&work_mutex); 
while(i) ( 


pthread_mutex_lock (&work_mutex) ; 

if (work_area[{0] t= '\0') { 
pthread_mutex_unlock (&work_mutex) ; 
sleep(1l); 

} 

else { 
break; 

} 


} 
) 
pthread_mutex_unlock(é&work_mutex} ; 
printf(*\nWaiting for thread to finish...\n"); 
res = pthread_join(a_thread, &thread_resulrc); 
if {res != 0) { 

perror(*Thread join failed"); 

exit (EXIT_FAILURE): 
} 
printf(*Thread joined\n"); 
pthread_mutex_destroy (&work_mutex) ; 
exit (EXIT_SUCCESS); 

} 


void *thread_function(void targ) { 
sleep(1); 
pthread_mutex_lock(&work_mutex) ; 
while(strncmp("end*, work_area, 3) != 0) { 
printf(*You input #d characters\n", strlen(work_area) -1}; 
work_area[0} = '\0'; 
pthread_mutex_unlock (&work_mutex) ; 
sleep(1); 
pthread_mutex_lock(&work_mutex) ; 
while (work _area[0] == '\0' ) { 
pthread_mutex_unlock(&work_mutex) ; 
sleep(i); 
pthread_mutex_lock (&work_mutex) ; 
} 
} 
time_to_exit = 1; 
work_area[0] = ‘\0"; 
pthread mutex unlock (&work_mutex) ; 
pthread_exit(0); 


} 

$ ce -D_REENTRANT thread4.c -o thread4 -lpthread 
$ ./threadé 

Input some text. Enter ‘end’ to finish 

Whit 


You input 4 characters 
The Crow Road 

You input 13 characters 
end 


Waiting for thread to finish... 
Thread joined 


实验 解析 
在 程序 的 开始 ， 我 们 声明 了 一 个 互 斥 量 、 工 作 区 和 一 个 变量 
time to_exit。 如 下 所 示 : 


#define WORK_SIZE 1024 
char work_area[WORK_SIZE]; 
int time to exit = 0; 


接 下 来 局 动 新 线程 。 下 面 是 在 线程 函数 中 执行 的 代码 : 


while{(strncm end work_area, 3 f= 0 
int characters\n", strlen(work_area 
rk 4 
hre „mu 
rk_mutex); 
à Oe | 
& k mute 
mutex work mut 


新 线程 首先 试图 对 互 斥 量 加 锁 。 如 果 它 已 经 被 锁 住 ， 这 个 调用 将 被 
阻塞 直到 它 被 释放 为 止 。 一 旦 获得 访问 权 ， 我 们 就 检查 是 否 有 申请 退出 
程序 的 请 求 。 如 果 有 ， 就 设置 time to_exit 变 量 ， 再 把 工作 区 的 第 一 个 字 
符 设置 为 0， 然 后 退出 。 

如 果 不 想 退出 ， 束 统计 字符 个 数 ， 然 后 把 work_area 数 组 中 的 第 一 
个 字符 设置 为 nul。 我 们 用 将 第 一 个 字符 设置 为 null 的 方法 通知 读 取 输入 
的 线程 ， 我 们 已 完成 了 字符 统计 。 然 后 解锁 互 斥 量 并 等 待 主线 程 继 续 运 
行 。 我 们 将 周期 性 地 党 试 给 互 斥 量 加 锁 ， 如 果 加 锁 成 功 ， 束 检查 是 否 主 
线程 又 有 字符 送 来 要 处 理 。 如 果 还 没有 ， 束 解锁 互 斥 量 继续 等 待 : 如 果 
有 ， 就 统计 字符 个 数 并 再 次 进入 循环 。 
下 面 是 主线 程 的 代码 : 


pthread_mutex_lock(&work_mutex) ; 


printf ("Input some text. Enter 'end' to finish\n"); 


while({!time_to_exit) { 
Li mr aT? my ey Ns 
work_area, WORK_SIZE, stdin); 


pthread_mutex_unlock(&work_mutex) ; 


hyras $ ary m PE oe = 1 $ > o 
pthread_mutex_lock(&work_mutex); 
sE (vn DRS y E T f 
if (work_area[0) ‘= '\0 { 
pthread_mutex_unlock (&work_mutex)} ; 


sleep(1); 


pthread_mutex_unlock (&work_mutex) ; 

这 段 代 码 和 上 面 新 线程 中 的 很 类 似 。 我 们 首先 给 工作 区 加 锁 ， 读 入 
文本 到 它 里 面 ， 然 后 解锁 以 允许 其 他 线程 访问 它 并 统计 字符 数目 。 我 们 
周期 性 地 对 互 斥 量 再 加 锁 ， 检 碍 字符 数目 是 否 已 统计 完 (work_area[0] 
被 设置 为 null) 。 如 果 还 需要 等 待 ， 束 释 放 互 斥 量 。 如 前 所 述 ， 这 种 通 
过 轮 询 来 获得 结果 的 方法 通常 并 不 是 好 的 编程 方式 。 在 实际 的 编程 中 ， 
eee eee eee ee 
ATT Es 


12.6 ”线程 的 属 ' 


在 第 一 次 介绍 创建 线程 的 函数 时 ， 我 们 并 未 讨论 更 高 级 的 线程 属性 
问题 。 现 在 我 们 已 介绍 完了 同步 线程 的 主题 ， 可 以 回头 来 看 这 些 线程 目 
有 身 的 更 高 级 特性 了 。 我 们 可 以 控制 的 线程 属性 非常 多 ， 但 在 这 里 我 们 将 
one Nee 其 他 属性 的 详细 资料 可 以 在 手册 页 中 找 

Io 

在 前 面 的 所 有 程序 示例 中 ， 我 们 都 在 程序 退出 之 前 用 pthread_join 对 
线程 再 次 进行 同步 ， 如 果 我 们 想 让 线程 同 创 建 它 的 线程 返回 数据 就 需要 
这 样 做 。 但 有 时 也 会 有 这 种 情况 ， 我 们 既 不 需要 第 二 个 线程 回 主 线程 返 
回信 息 ， 也 不 想 让 主线 程 等 待 它 的 结束 。 

假设 我 们 在 主线 程 继 续 为 用 户 提供 服务 的 同时 创建 了 第 二 个 线程 ， 
新 线程 的 作用 是 将 用 户 正 在 编辑 的 数据 文件 进行 备份 存储 。 备 份 工作 结 
束 后 ， 第 二 个 线程 就 可 以 直接 终止 了 ， 它 没有 必要 再 回 到 主线 程 中 。 

我 们 可 以 创建 这 一 类 型 的 线程 ， 它 们 被 称 为 脱离 线程 〈detached 
thread) 。 可 以 通过 修改 线程 属性 或 调用 pthread ”detach 的 方法 来 创建 它 
们 ae 目的 是 介绍 线程 的 属性 ， 所 以 在 这 里 我 们 就 使 用 前 一 种 
Hikes 

需要 用 到 的 最 重要 的 函数 是 pthread_attr_init， 它 的 作用 是 初始 化 一 
个 线程 属性 对 象 。 


#include <pthread.h> 


int pthread_attr_init(pthread_attr_t *attr); 


与 前 面 的 函数 一 样 ， 它 在 成 功 时 返回 0， 失 败 时 返回 错误 代码 。 

还 有 一 个 回收 函数 pthread_attr_destroy， 它 的 目的 是 对 属性 对 象 进 
行 清理 和 回收 。 一 旦 对 象 被 回收 了 ， 除 非 它 被 重新 初始 化 ， 否 则 残 不 能 
被 再 次 使 用 。 

初始 化 一 个 线程 属性 对 象 后 ， 我 们 可 以 调用 许多 其 他 的 函数 来 设置 
不 同 的 属性 行为 。 我 们 把 其 中 主要 的 一 些 函 数列 在 下 面 〈 完 整 的 列表 见 
手册 页 ， 通 常 位 于 pthread.h 条 目下 ) ， 但 只 对 其 中 的 两 个 〈detachedstate 
和 schedpolicy) 做 详细 的 介绍 : 


#@include <pthread.h> 
int pthread _attr_setdetachstate(pthread_attr_t ‘attr, int detachstate); 
int pthread_attr_getdetachstate(const pthread_attr_t ‘attr, int *detachstate); 


int pthread_attr_setschedpolicy(pthread_attr_t ‘attr, int policy); 


int pthread_attr_getschedpolicy(const pthread_attr_t *attr, int *policy); 


int pthread_attr_setschedparam(pthread_attr_t *attr, const struct sched param 
*param); 


int pthread attr _getschedparam(const pthread_attr_t ‘attr, struct sched_param 
*param); 


int pthread_attr_setinheritsched(pthread attr_t *attr, int inherit); 

int pthread _attr_getinheritsched(const pthread attr t *attr, int *inherit); 
int pthread_attr_setscope(pthread_attr_t ‘attr, int scope); 

int pthread_attr_getscope(const pthread _attr_t ‘attr, int *scope); 

int pthread_attr_setstacksize(pthread_ attr_t ‘attr, int scope); 


int pthread_attr_getstacksize(const pthread_attr_t *attr, int *scope); 

如 你 所 见 ， 可 以 使 用 的 线程 属性 非常 多 。 但 幸运 的 是 ， 你 通 铝 不 需 

要 设置 太 多 属性 就 可 以 让 程序 正常 工作 。 
© detachedstate: 这 个 属性 允许 我 们 无 需 对 线程 进行 重新 合并 。 与 
大 多 数 _set 类 函数 一 样 ， 它 以 一 个 属性 指针 和 一 个 标志 为 参数 来 确 
定 需 要 的 状态 。pthread_attr_setdetachstate 函 数 可 能 用 到 的 两 个 标志 
分 别 是 PTHREAD_CREATE JOINABLE 和 
PTHREAD_CREATE_DETACHED。 这 个 属性 的 默认 标志 值 是 
PTHREAD_CREATE_JOINABLE， 所 以 可 以 允许 两 个 线程 重新 合 
并 。 如 果 标 志 设 置 为 PTHREAD _CREATE_DETACHED， 就 不 能 调 
用 pthread_join 来 获得 男 一 个 线程 的 退出 状态 。 
O schedpolicy: 这 个 属性 控制 线程 的 调度 方式 。 它 的 取 值 可 以 是 
SCHED_OTHER、SCHED_RP 和 SCHED_FIFO。 这 个 属性 的 默认 值 
为 SCHED_OTHER。 男 外 两 种 调度 方式 只 能 用 于 以 超级 用 户 权 限 运 
行 的 进程 ， 因 为 它们 都 具备 实时 调度 的 功能 ， 但 在 行为 上 略 有 区 
别 。SCHED_RP 使 用 循环 (round-robin) 调度 机 制 ， 而 
SCHED_FIFO 使 用 “先进 先 出 ”策略 。 
口 schedparam: 这 个 属性 是 和 schedpolicy 属 性 结合 使 用 的 ， 它 可 以 
对 以 SCHED_OTHER 策 略 运 行 的 线程 的 调度 进行 控制 。 我 们 将 在 本 
章 的 后 面 看 到 一 个 使 用 这 个 属性 的 例子 。 
O inheritsched: 这 个 属性 可 取 两 个 值 : 
PTHREAD EXPLICIT SCHED 和 PTHREAD INHERIT SCHED. 


它 的 默认 取 值 是 PTHREAD_EXPLICIT SCHED， 表 示 调 度 由 属性 
明确 地 设置 。 如 果 把 它 设置 为 PTHREAD _INHERIT_ SCHED， 新 线 
程 将 治 用 其 创建 者 所 使 用 的 参数 。 

O scope: 这 个 属性 控制 一 个 线程 调度 的 计算 方式 。 由 于 目前 
Linux 只 支持 它 的 一 种 取 值 PTHREAD_ SCOPE SYSTEM， 所 以 在 这 
里 我 们 就 不 做 进一步 介绍 了 。 

O stacksize: 这 个 属性 控制 线程 创建 的 栈 大 小 ， 单 位 为 字 节 。 它 
属于 POSIX 规 范 中 的 “可 选 * 部 分 ， 只 有 在 定义 了 宏 
_POSIX_THREAD_ATTR_STACKSIZE 的 实现 版 本 中 才 支 持 。 
Linux 在 实现 线程 时 ， 默 认 使 用 的 栈 很 大 ， 所 以 这 个 功能 对 Linux 来 
说 显得 有 些 多 余 。 


实 验 设置 脱离 状态 属性 

在 脱离 线程 示例 thread5.c 中 ， 我 们 创建 一 个 线程 属性 ， 将 其 设置 为 
脱离 状态 ， 然 后 用 这 个 属性 创建 一 个 线程 。 子 线程 结束 时 ， 它 照常 调用 
pthread_exit， 但 这 次 ， 原 先 的 线程 不 再 等 待 与 它 创 建 的 子 线程 重新 合 
并 。 主 线程 通过 一 个 简单 的 thread_finished 标 志 来 检测 子 线程 是 否 已 经 
结束 ， 并 显示 线程 之 间 仍 然 共 享 着 变量 。 


Sinclude <stdio.h> 

finclude <unistd.h> 
include <stdlib.h> 
Pinclude <pthread.h> 


void *thread_function(void *arg}; 


char message[] = *Hello World’: 
int thread_finished = 0; 


int main() { 
int res; 
pthread_t a_thread; 


pthread_attr_t thread_attr; 


res = pthread_attr_init(éthread_ attr); 
if (res t= 0) { 
perror(*Attribute creation failed*}; 
exit (EXIT_FAILURE) ; 
) 
res = pthread_attr_setdetachatate(athread_attr, PTHREAD_CREATE_DETACHED); 
if (res [= 0) ( 
perror(*Setting detached attribute failed"); 
exit (EXIT_FAILURE) ; 
) 
res = pthread _create(éa_thread, athread_attr, 
thread_function, (void *)message); 
if (res != 0) { 
perror("Thread creation failed"); 
exit (EXIT_FAILURE) ; 
} 
(void) pthread_attr_destroy(athread_attr}; 
while(!thread_finished) { 
printf ("Waiting for thread to say it's finished...\n*); 
sleep(l): 
) 
printf(*Other thread finished, bye! \n*); 
exit (EXIT_SUCCESS}; 
} 


void *thread_function(void *arg) ( 
printf{(*thread function is running. Argument was 4s\n*, (char *)arg); 
sleep (4); 
printf{("Second thread setting finished flag, and exiting now\n"); 
thread_finished = 1; 
pthread_exit (NULL) ; 


输出 结果 是 : 

$ ./thread5 
Waiting for thread to say it's finished... 
thread_function is running. Argument was Hello World 
Waiting for thread to say it's finished... 
Waiting for thread to say it's finished... 
Waiting for thread to say it's finished... 

Second thread setting finished flag, and exiting now 
Other thread finished, bye! 


如 你 所 见 ， 设 置 脱离 状态 属性 可 以 允许 第 二 个 线程 独立 地 完成 工 
作 ， 而 无 需 原 先 的 线程 等 竺 它 。 

实验 解析 

这 个 程序 中 有 两 段 比较 重要 的 代码 ， 第 一 段 代 码 是 : 


pthread_attr_t thread_attr; 


res = pthread_attr_init (&thread_attr) ; 
if (res != 0) { 
perror ("Attribute creation failed"); 
exit (EXIT_FAILURE) ; 


1 


它 声明 了 一 个 线程 属性 并 对 其 进行 初 给 化 第 二 段 代码 是 : 


rhread_attr_setdetachstate(&tnread_attr, PYHKEAD_CKEATE_UNIAUCNEY) ; 
f (res != 0) í 
perror ("Set ing detached attribute failed") 
exit(EXIT_FAILURE) 


它 把 属性 的 值 设 置 为 脱离 状态 。 
其 他 的 细微 区 别 是 创建 线程 和 传递 属性 的 地 址 : 


res = pthread create(&a_ thread, &thread_attr, thread_function, void 


*)}) message 


属性 用 完 后 ， 对 其 进行 清理 回收 ;: 
ptnread_attr_destroy(&tnreaq_attr); 
线程 属性 又 
我 们 来 看 另外 一 个 可 能 希望 修改 的 线程 属性 : 调度 。 改 变调 度 属性 
和 设置 脱离 状态 非常 类 似 ， 可 以 用 sched_get_priority_max 和 
sched_get_priority_min 这 两 个 函数 来 查找 可 用 的 优先 级 级 别 。 


实 验 调度 
因为 这 里 的 程序 thread6.c 与 前 面 的 例子 很 相似 ， 所 以 我 们 只 显示 它 
与 前 面 例子 的 不 同 之 处 。 
(1) 首先 ， 定 义 一 些 额外 的 变量 : 
int max_priority; 
int min_priority; 
struct sched_param scheduling_value; 


(2) 设置 好 脱离 属性 后 ， 设 置 调度 策略 : 
res = pthread_attr_setschedpolicy(&thread_attr, SCHED OTHER); 
if (res != 0) { 
perror ("Setting scheduling policy failed"); 
exit (EXIT_FAILURE) ; 


(3) 接 下 来 查找 允许 的 优先 级 范围 : 


max_priority 
min_priority 


sched_get_priority_max (SCHED_OTHER) 
sched_get_priority_min (SCHED_OTHER) 


(4) 然后 设置 优先 级 : 


scheduling_value.sched_priority = min_priority; 
res = pthread_attr_setschedparam(&thread_attr, &scheduling_value) ; 
if (res != 0) { 

perror ("Setting scheduling priority failed’); 

exit (EXIT_FAILURE) ; 


运行 这 个 程序 ， 它 的 输出 如 下 所 示 : 
$ ./thread6 
Waiting for thread to say it's finished... 


thread_function is running. Argument was Hello World 
Waiting for thread to say it's finished... 

Waiting for thread to say it's finished... 

Waiting for thread to say it's finished... 

Second thread setting finished flag, and exiting now 
Other thread finished, bye! 


实验 解析 
这 与 设置 脱离 状态 属性 很 相似 ， 区 别 只 是 我 们 设置 的 是 调度 策略 。 


12.7 取消 一 个 线程 


有 时 ， 我 们 想 让 一 个 线程 可 以 要 求 另 一 个 线程 终止 ， 就 像 给 它 及 送 
一 个 信号 一 样 。 线 程 有 方法 可 以 做 到 这 一 点 ， 与 信号 处 理 一 样 ， 线 程 可 
以 在 被 要 求 终止 时 改变 其 行为 。 

先 来 看 看 用 于 请 求 一 个 线程 终止 的 函数 : 


#include <pthread.h> 


int pthread_cancel(pthread_t thread); 

XARA ESC fil SS Te tet Se APE, RATE DN cies 
TaAAOR RGB E . (ATER DOA ERE m SRT STATA IR — AS 
过 也 不 是 非常 复杂 。 线 程 可 以 用 pthread_setcancelstate 设 置 自 己 的 取消 状 


#include <pthread.h> 


int pthread_setcancelstate(int state, int *oldstate) ; 

第 一 个 参数 的 取 值 可 以 是 PTHREAD_CANCEL_ENABLE， 这 个 值 
允许 线程 接收 取消 请 求 ， 或 者 是 PTHREAD_CANCEL DISABLE， 它 的 
作用 是 忽略 取消 请 求 。oldstate 指 针 用 于 获取 先前 的 取消 状态 。 如 果 你 对 
它 没 有 兴趣 ， 只 需 传递 NULL 给 它 。 如 果 取 消 请 求 被 接受 了 ， 线 程 就 可 
以 进入 第 二 个 控制 层次 ， 用 pthread_setcanceltype 设 置 取消 类 型 。 


#include <pthread.h> 


int pthread_setcanceltype(int type, int *oldtype); 

type 人 参数 可 以 有 两 种 取 值 : 一 个 是 
PTHREAD_CANCEL_ASYNCHRONOUS， 它 将 使 得 在 接收 到 取消 请 求 
后 立即 采取 行动 ， 另 一 个 是 PTHREAD_CANCEL_DEFERRED， 它 将 使 
得 在 接收 到 取消 请 求 后 ， 一 直 等 待 直到 线程 执行 了 下 述 函数 之 一 后 才 采 
取 行 动 。 有 具体 是 函数 pthread_join、pthread_cond_wait、 
pthread_cond_timedwait、pthread_testcancel、sem_wait 或 sigwait。 

我 们 在 本 章 中 不 会 对 它们 全 部 进行 介绍 ， 因 为 并 不 是 所 有 这 些 函 数 
e 与 往常 一 样 ， 更 详细 的 资料 可 以 在 它们 的 手册 页 中 找 
ljo 


根据 POSIX 标 准 ， 其 他 可 能 阻塞 的 系统 调用 ， 如 read、wait 等 


也 可 以 成 为 取消 点 。 在 撰写 本 书 时 ，Linux 还 不 支持 所 有 这 些 系 统 
调用 都 能 成 为 取消 点 。 但 一 些 实验 证 明 ， 某 些 阻塞 调用 ， 如 sleep 确 
实 允 许 取 消 动作 的 发 生 。 为 安全 起 见 ， 你 可 能 会 想 在 估计 会 被 取消 
的 代码 中 添加 一 些 pthread_testcancel 调 用 。 


oldtype 参 数 可 以 保存 先前 的 状态 ， 如 果 不 想 知道 先前 的 状态 ， 可 以 
传递 NULL 给 它 。 默 认 情 况 下 ， 线 程 在 启动 时 的 取消 状态 为 
PTHREAD_CANCEL _ENABLE， 取 消 类 型 是 PTHREAD_ 
CANCEL_DEFERRED. 


K 验 取 一 个 线程 
程序 thread7.c 还 是 基于 threadl.c。 这 一 次 ， 主 线程 向 它 创 建 的 线程 


clude <std 


lude <un 
Sinciluce <staiib. n> 


res = pthread _join(a_thread, &thread_result); 
if (res != 0) { 

perror ("Thread join failed"); 

exit (EXIT_FAILURE) ; 
} 


exit (EXIT_SUCCESS) ; 


void *thread_function(void targ) { 
int i, res; 
res = pthread_setcancelstate (PTHREAD_CANCEL_ENABLE, NULL); 
if (res t= 0) { 
perror ("Thread pthread_setcancelstate failed"); 
exit (EXIT_FAILURE) ; 
} 
res = pthread_setcanceltype(PTHREAD_CANCEL DEFERRED, NULL); 
if (res != 0) { 
perror(*Thread pthread_setcanceltype failed"); 
exit (EXIT_FAILURE) ; 
printf(*thread_function is running\n") ; 
for(i = 0; i < 10; i++) ( 
printf ("Thread is still running (%d)...\n", i); 
sleep(1); 


pthread_exit (0); 
} 


0 E 
消 : 

$ ./thread7 

thread_function is running 

Thread is still running (0)... 

Thread is still running (1)... 

Thread is still running (2)... 

Canceling thread... 

Waiting for thread to finish... 


$ 


实验 解析 
以 通 第 的 方法 创建 了 新 线程 后 ， 主 线程 休眠 一 会 儿 〈 好 让 新 线程 有 
时 间 开 始 执 行 》， 然 后 发 送 一 个 取消 请 求 。 如 下 所 示 : 


sleep (3); 

printf("Cancelling thread...\n"); 
res = pthread_cancel (a_thread) ; 
if (ës t= OF { 


perror("Thread cancelation failed"); 
exit (EXIT_FAILURE); 
} 


在 新 创建 的 线程 中 ， 我 们 首先 将 取消 状态 设置 为 允许 取消 ， 如 下 所 


>| 


res = pthread_setcancelstate(PTHREAD_CANCEL_ENABLE, NULL); 
if (res != 0) { 


perror("Thread pthread_setcancelstate failed"); 


exit (EXIT_FAILURE) ; 
} 


PCR BURR EA HEIR GA, SR Bias: 


res = pthread_setcanceltype(PTHREAD_CANCEL_DEFERRED, NULL); 
if (res te 0) { 


perror("Thread pthread_setcanceltype failed"); 
exit (EXIT_FAILURE) ; 


最 后 ， 线 程 在 循环 中 等 待 被 取消 ， 如 下 所 示 : 
for(i = 0; i < 10; i++) { 
printf("Thread is still running (%d)...\n", 


+ BE 
sleep(1); 


12.8 ”多 线程 


至 此 ， 我 们 总 是 让 程序 的 主 执行 线程 仅仅 创建 一 个 线程 。 但 我 们 并 
不 想 让 读者 认为 你 只 能 多 创建 一 个 线程 。 


实 验 多 线程 
在 本 章 最 后 的 例子 thread8.c 中 ， 我 们 将 演示 如 何在 同一 个 程序 中 创 
建 多 个 线程 ， 然 后 又 如 何以 不 同 于 其 局 动 的 顺序 将 它们 合并 到 一 起 。 


#include <stdio.h> 
#include <unistd.h> 
include <stdlib.h> 
include <pthread.h> 


define NUM_THREADS 6 
void *thread_ function(void *arg); 


int main{} { 
int res; 
pthread_t a_thread[NUM_THREADS] ; 
void *thread_result; 
int lots_of_threads; 


for(lots_of_threads = 0; lots_of_threads < NUM_THREADS; lots_of_threads++) { 
res = pthread_create(&(a_thread[lots_of_threads]), 
NULL, thread_function, (void *)&lots_of_threads) ; 
if (res t= 0) { 
perror ("Thread creation failed"); 
exit (EXIT_FAILURE) ; 
} 
sleep(1); 
) 
printf(*Waiting for threads to finish...\n"); 
for(lots_of_threads = NUM_THREADS - 1; lots_of_threads >= 0; 
lots_of_threads--) { 


res = pthread_join(a_thread[lots_of_ threads), &thread_result); 
if {res == 0) { 
printf ("Picked up a thread\n"); 
) 
else { 
perror("pthread_join failed’); 
) 


) 
printf£("All done\n"); 
exit (EXIT_SUCCESS) ; 

} 


void *thread_function(void *arg) { 
int my_number = *(int *jarg; 
int rand_num; 


printf (*thread_function is running. Argument was %d\n", my_noumber); 
rand_numel+ (int) (9.0*rand() / (RAND_MAX+1.0)); 

sleep (rand_num) ; 

printf{*Bye from td\n", my_number); 

pthread_exit (NULL); 


运行 这 个 程序 时 ， 将 看 到 如 下 所 示 的 输出 结果 : 
$ ./thread8 

thread function is running. Argument was 
thread_function is running. Argument was 
thread_function is running. Argument was 
thread_function is running. Argument was 
thread_function is running. Argument was 
Bye from 1 

thread_function is running. Argument was 5 
Waiting for threads to finish... 

Bye from 5 

Picked up a thread 

Bye from 0 

Bye from 2 

Bye from 3 

Bye from 4 
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Picked up a thread 
Picked up a thread 
Picked up a thread 
Picked up a thread 
Picked up a thread 
All done 


如 你 所 见 ， 我 们 创建 了 许多 线程 并 让 它们 以 随意 的 顺序 结束 执行 。 
这 个 程序 有 一 个 小 漏洞 ， 如 果 将 sleep 调 用 从 启动 线程 的 循环 中 删除 ， 它 
就 会 变 得 很 明显 。 我 们 通过 它 提 醒 读 者 ， 在 编写 使 用 线程 的 程序 时 需要 
多 么 小 心 。 你 发 现 错误 在 哪里 了 吗 ? 我 们 将 在 下 面 的 “实验 解析 ”中 解释 


Eo 

实验 解析 

这 一 次 ， 我 们 创建 了 一 个 线程 ID 的 数组 ， 如 下 所 示 : 
pthread_t a_thread[NUM_THREADS] ; 


然后 通过 循环 创建 多 个 线程 ， 如 下 所 示 : 


f ea of rhreads < NUM_THREA of thread 
t a th lots_of_thread VULL 
t id_f tio 1 A f e 
hre rea n failed 
E _FAILURE 


创建 出 的 线程 等 待 一 段 随机 的 时 间 后 退出 运行 ， 如 下 所 示 : 


void *thread_function(void *arg) { 
int my_number = *(int “larg; 
int rand num; 


printf("*thread_function is running. Argument was d\n", my number); 
rand_num=1+ (int) (9.0*rand({) / (RAND_MAX+1.0}); 

sleep{rand_num) ; 

printf("Bye from td\n"*, my_number) ; 

pthread_exit (NULL); 


在 主 ( 原 先 ) 线程 中 ， 我 们 等 符合 并 这 些 子 线程 ， 但 并 不 是 以 创建 
它们 的 顺序 来 合并 ， 如 下 所 示 : 


$ 


of threads = NUM_THREADS 1; lots_of_threads >= 0; lots_of_threads-- 
es = pthread_join(a_thread[lots_of threads), athread_result}; 
if (res == 0 


princfé(*Picked up a threadin’); 


else [ 


perror("pthread_join failed*"}; 


OHM ER sleep val H a FI TIN “MEP, CRY eae Bl — Ee ay PE 
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thread_tunction is running. Argument was 
thread_function is running. Argument was 
thread_function is running. Argument was 
thread_function is running. Argument was 
thread_function is running. Argument was 
thread_function is running. Argument was 
Waiting for threads to finish... 
Bye from 5 
Picked up a thread 
Bye from 2 
Bye from 0 
Bye from 2 
Bye from 4 
Bye from 4 
Picked up a thread 
Picked up a thread 
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Picked up a thread 

Picked up a thread 

Picked up a thread 

All done 

你 能 发 现 为 什么 会 出 现 这 样 的 问题 吗 ? 启动 线程 时 ， 线 程 函 数 的 参 


ae me fella SE 引起 问题 的 代码 行 是 


NU wa 


如 果 主 线程 运 二 行 得 足够 快 就 有 可 有 改变 某 些 线程 的 参数 CBP 
lots_of_threads) 。 当 对 共享 变量 和 多 个 执行 路 径 没有 做 到 足够 重视 时 ， 
EFRA A 出 现 这 样 的 错 吴 行 为 。 我 们 已 经 警告 过 ， 编 写 线程 程序 时 
需要 在 设计 上 特别 小 心 。 要 改正 这 个 问题 ， 我 们 可 以 直接 传递 这 个 参数 
的 全， 如 下 所 示 : 


tTnreaa( 10ts_O©f_tnreacs 


yf 然 还 ser =i road? function 函 数 ， 如 下 所 示 : 
void *thread_frunction(void *arg) {q 
int my_number = (int)arg; 


这 些 修改 都 在 程序 thread8a.c 中 以 阴影 部 分 显示 出 来 了 ， 如 下 所 示 : 


文 些 修改 都 在 程序 ' GBA, PUNEN MEHL J. WFA: 


es = pthread_create(4(a_thread[lots_of _threads]), NULL, 
thread_function, (void *) lots_of_threads) ; 
if (res le 0) i 
perror(*Thread creation failed"); 
exit (EXIT_FAILURE) ; 


printf(°All done\n"); 


exit (EXIT_SUCCESS) ; 
} 


void *thread_function(void *arg) { 
int my_number = (int)arg; 
int rand_num; 


printf(*thread_function is running. Argument was %d\n*, my_number); 
rand_num=1+(int} (9.0*rand() / (RAND_MAX+1.0)); 

sleep (rand_num) ; 

printf("Bye from %d\n", my_number); 


pthread_exit (NULL) ; 


12.9 小结 


在 本 章 中 ， 我 们 介绍 了 如 何在 一 个 进程 中 创建 多 个 执行 线程 ， 每 个 
线程 共 译 着 文件 范围 的 变量 。 接 着 ， 我 们 介绍 了 线程 对 关键 代码 和 数据 
的 两 种 访问 控制 方法 一 一 使 用 信号 量 和 互 斥 量 。 此 后 ， 我 们 介绍 了 如 何 
控制 线程 的 属性 ， 特 别 介绍 了 如 何 才能 将 子 线程 和 主线 程 分 离开 来 ， 使 
主线 程 无 需 等 待 它 创建 的 子 线程 终止 运行 。 在 简单 介绍 完 一 个 线程 如 何 
请 求 男 一 个 线程 结束 运行 以 及 接收 端的 线程 如 何 处 理 这 类 请 求 之 后 ， 我 
们 展示 了 一 个 有 多 个 并 发 执行 线程 的 程序 示例 。 

我 们 没有 详细 介绍 每 个 函数 调用 和 与 线程 有 关 的 各 类 事物 ， 但 你 现 
在 应 该 对 线程 有 了 初步 的 了 解 了 ， 可 以 尝试 编写 自己 的 线程 程序 了 。 通 
过 阅读 相关 的 手册 页 ， 你 可 以 对 线程 有 更 加 深入 的 了 解 。 
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方法 : 使 用 信和 号。 我 们 创建 通知 事件 ， 通 过 它 引 起 响应 ， 但 传送 的 信息 


只 限于 一 个 信号 值 。 
在 本 章 中 ， 我 们 将 介绍 管道 ， 通 过 它 进程 之 间 可 以 交换 更 有 用 的 数 


据 。 在 本 章 的 最 后 ， 我 们 将 用 新 学 到 的 知识 将 CD 数据 库 应 用 程序 重新 
实现 为 一 个 非常 简单 的 客户 /服务 器 应 用 程序 。 
我 们 将 在 本 章 中 介绍 以 下 几 方 面 的 内 容 : 


口 口 口 口 口 口 


管道 的 定义 
进程 管道 
管道 调用 

父 进程 和 子 进 程 
命名 管道 : FIFO 
客户 /服务 器 架构 


13.1 什么 是 管道 


当 从 一 个 进程 连接 数据 流 到 另 一 个 进程 时 ， 我 们 使 用 术语 管道 


(pipe) 。 我 们 通常 是 把 一 个 进程 的 输出 通过 管道 连接 到 另 一 个 进程 的 
输入 。 


大 多 数 Linux 的 用 户 应 该 早已 对 将 shel 命 令 连接 在 一 起 的 概念 很 风 


GY, yas ape aL ileal Fy — TEFEN HA o 
对 于 shell 命 令 来 说 ， 命 令 的 连接 是 通过 管道 字符 来 完成 的 ， 如 下 所 未 : 


接 ， 


cmd1 | cmd2 

shell 负 责 安排 两 个 命令 的 标准 输入 和 标准 输出 。 

O cmdil 的 标准 输入 来 自 终 端 键盘 。 

o cmd1 的 标准 输出 传递 给 cmd2， 作 为 它 的 标准 输入 。 

O cmd2 的 标准 输出 连接 到 终端 屏幕 。 

shell 所 做 的 工作 实际 上 是 对 标准 输入 和 标准 输出 流 进行 了 重新 连 
使 数据 流 从 键盘 输入 通过 两 个 命令 最 终 和 输出 到 屏幕 上 ， 见 图 13-1。 
在 本 章 中 ， 我 们 将 看 到 如 何在 程序 中 获得 这 样 的 效果 ， 怎 样 用 管道 


将 多 个 进程 连接 起 来 ， 从 而 实现 一 个 简单 的 客户 /服务 器 系统 。 


/ 标准 输入 


ms) ops Yana TE ome > -一 


图 13-1 


13.2 ”进程 管道 


可 能 最 简单 的 在 两 个 程序 之 间 传 递 数据 的 方法 就 是 使 用 popen 和 
pclose 函 数 了 。 它 们 的 原型 如 下 所 示 : 


#include <stdio.h> 


FILE *popen (const char *command, const char *open_mode) ; 

int pclose (FILE *stream_to_close) ; 

1. popen xX 

popen 函 数 允 许 一 个 程序 将 另 一 个 程序 作为 新 进程 来 启动 ， 并 可 以 
传递 数据 给 它 或 者 通过 它 接收 数据 。command 字 符 串 是 要 运行 的 程序 名 
和 相应 的 参数 。open_mode 必 须 是 “r” 或 者 “w”。 

如 果 open_mode 是 “"， 被 调用 程序 的 输出 就 可 以 被 调用 程序 使 用 ， 
调用 程序 利用 popen 函 数 返回 的 FILE* 文 件 流 指 针 ， 就 可 以 通过 常用 的 
stdio 库 函数 〈 如 fread) 来 读 取 被 调用 程序 的 输出 。 如 果 open_mode 
是 “w”， 调 用 程序 就 可 以 用 fwrite 调 用 同 被 调用 程序 友 送 数据 ， 而 被 调用 
程序 可 以 在 自己 的 标准 输入 上 读 取 这 些 数据 。 被 调用 的 程序 通常 不 会 意 
识 到 自己 正在 从 另 一 个 进程 读 取 数据 ， 它 只 是 在 标准 输入 流 上 读 取 数 
据 ， 然 后 做 出 相应 的 操作 。 

每 个 popen 调 用 都 必须 指定 ”或 “w”， 在 popen 函 数 的 标准 实现 中 不 
文 持 任何 其 他 选项 。 这 意味 着 我 们 不 能 调用 男 一 个 程序 并 同时 对 它 进 行 
读 写 操作 。popen 函 数 在 失败 时 返回 一 个 空 指针 。 如 果 想 通过 管道 实现 
双 回 通信 ， 最 普通 的 解决 方法 是 使 用 两 个 管道 ， 每 个 管道 负责 一 个 方 辐 
的 数据 流 。 

2. pcloserk ži 

用 popen 局 动 的 进程 结束 时 ， 我 们 可 以 用 pclose 函 数 关 闭 与 之 关联 的 
文件 流 。pclose 调 用 只 在 popen 局 动 的 进程 结束 后 才 返 回 。 如 果 调 用 
pclose 时 它 仍 在 运行 ，pclose 调 用 将 等 竺 该 进程 的 结束 。 

pcdlose 调 用 的 返回 值 通 常 是 它 所 关闭 的 文件 流 所 在 进程 的 退出 码 。 
如 果 调 用 进程 在 调用 pclose 之 前 执行 了 一 个 wait 语 句 ， 被 调用 进程 的 退 
出 状态 就 会 丢失 ， 因 为 被 调用 进程 已 结束 。 此 时 ，pclose 将 返回 -1 并 设 
置 ermo 为 ECHILD。 


X 验 读 取 外 部 程序 的 输出 
现在 来 看 一 个 简单 的 popen 和 pclose 示 例 程 序 popen1.c。 我 们 将 在 程 
序 中 用 popen 访 问 uname 命 令 给 出 的 信息 。 命 令 uname-a 的 作用 是 打印 系 


统 信息 ， 包 括 计 算 机 型 号 、 操 作 系 统 名 称 、 版 本 和 发 行 号 ， 以 及 计算 机 
的 网 络 名 。 


完成 程序 的 初始 化 工作 后 ， 打 开 一 个 连接 到 uname 命 令 的 管道 ， 把 
管道 设置 为 可 读 方 式 并 让 read_fp 指 问 该 命令 的 输出 。 最 后 ， 关 闭 
read_fp 指 癌 的 管道 。 


运行 这 个 程序 ， 我 们 将 看 到 如 下 所 示 的 输出 结果 (这 是 在 本 书 其 中 
一 位 作者 的 机 器 上 的 输出 结果 ) : 


popenl 


实验 解析 


这 个 程序 用 popen 调 用 启动 带 有 -a 选项 的 uname 命令 。 然 后 用 返回 的 
文件 流 读 取 最 多 BUFSIZ 个 字符 (这 个 常量 是 在 stdio.h 中 用 #define 语 句 定 
义 的 ) 的 数据 ， 并 将 它们 打印 出 来 显示 在 屏幕 上 。 因 为 我 们 是 在 程序 内 
部 捕获 uname 命 令 的 输出 ， 所 以 可 以 处 理 它 。 


13.3 Far HI TE popen 


看 过 捕获 外 部 程序 输出 的 例子 后 ， 我 们 再 来 看 一 个 将 输出 发 送 到 外 
部 程序 的 示例 程序 popen2.c， 它 将 数据 通过 管道 送 往 男 一 个 程序 。 我 们 
在 这 里 使 用 的 是 od (八进制 输出 〉 命令。 


SE 验 将 输出 送 往外 部 程序 
我 们 可 以 看 到 ， 下 面 这 个 程序 popen2.c 非 常 类 似 于 前 面 的 示例 程 
序 ， 唯 一 的 不 同 是 这 个 程序 是 将 数据 写 入 管道 ， 而 不 是 从 管道 中 读 取 。 


运行 这 个 程序 时 ， 我 们 将 看 到 如 下 所 示 的 输出 结果 : 


实验 解析 
程序 使 用 这 有 参数 “w” 的 popen 启 动 od-c 命 令 ， 这 样 就 可 以 同 该 命令 
发 送 数据 了 。 然 后 它 给 od-c 命 令 发 送 一 个 字符 串 ， 该 命令 接收 并 处 理 
它 ， 最 后 把 处 理 结果 打印 到 自己 的 标准 输出 上 。 

在 命令 行 上 ， 我 们 可 以 用 下 面 的 命令 得 到 同样 的 输出 结果 : 


> echo "Once upon a time, there was..." | od -c 


13.3.1 {Erb Z ade 
我 们 目前 所 使 用 的 机 制 都 只 古 将 所 有 数据 通过 一 次 fread 或 fwrite 调 


用 来 发 送 或 接收 。 有 时 ， 我 们 可 能 希望 能 以 块 方式 发 送 数据 ， 或 者 我 们 
根本 就 不 知道 输出 数据 的 长 度 。 为 了 避免 定义 一 个 非常 大 的 缓冲 区 ， 我 
们 可 以 用 多 个 fread 或 fwrite 调 用 来 将 数据 分 为 几 部 分 处 理 。 

下 面 这 个 程序 popen3.c 通 过 管道 读 取 所 有 数据 。 


实 验 通过 管道 恋 取 大 量 数据 
在 这 个 程序 中 ， 我 们 从 被 调用 的 进程 ps ax 中 读 取 数据 。 访 进程 输出 
的 数据 有 多 少 事先 无 法 知道 ， 所 以 我 们 必须 对 管道 进行 多 次 读 取 。 


$include <stdlib.h> 
#include <stdio.h> 
@include <string.h> 


ma 
buf 
cha 
memset (buffer, '\0', sizeof(buffer)}; 
ead_ popen("ps ax’, 'r 
if (read_fp != NULL) { 


chars_read = fread{buffer, sizeof(char), BUFSIZ, read_fp); 
while (chars_read > 0) { 

buf fer[chars read - 1) = '\0'; 

printf(*Reading %d:-\n ts\n*, BUFSIZ, buffer); 

chars_read = fread(buffer, sizeof(char), BUFSIZ, read_fp); 


exit (EXIT_FAILURE) ; 


为 简洁 起 见 ， 我 们 对 程序 的 输出 做 了 一 些 修改 ， 如 下 所 示 : 


$ ./popen3 
Reading 1024:- 
PID TTY STAT TIME COMMAND 


? Ss 0:03 init [5] 
? SW 0:00 [kflushd] 
3 ? SW 0:00 [kpiod] 
4 ? SW 0:00 [kswapd] 
5 ? SW< 0:00 [mdrecoveryd] 


240 tty2 S 0:02 emacs draftl.txt 
Reading 1024:- 

368 ttyl S 0:00 ./popen3 

369 ttyl R 0:00 ps -ax 


实验 解析 

这 个 程序 调用 popen 函 数 时 使 用 了 “> 参数， 这 与 popen1.c 程 序 的 做 
法 一 样 。 这 次 ， 它 连续 从 文件 流 中 读 取 数据 ， 直 到 没有 数据 可 读 为 止 。 
注意 ， 虽 然 ps 命 令 的 执行 要 花费 一 些 时 间 ， 但 Linux 会 安排 好 进程 间 的 
调度 ， 让 两 个 程序 在 可 以 运行 时 继续 运行 。 如 果 读 进程 popen3 没 有 数据 
可 读 ， 它 将 被 挂 起 直到 有 数据 到 达 。 如 果 写 进程 ps 产生 的 输出 超过 了 可 
用 缓冲 区 的 长 度 ， 它 也 会 被 挂 起 直到 读 进 程 读 取 了 一 些 数据 。 

在 本 例 中 ， 你 可 能 不 会 看 到 Reading: -信息 的 第 二 次 出 现 。 如 果 
BUFSIZ 的 值 超过 了 ps 命令 输出 的 长 度 ， 这 种 情况 就 会 发 生 。 一 些 〈 最 
新 的 ) Linux 系 统 将 BUFSIZ 设 置 为 8 192 或 更 大 的 数字 。 为 了 测试 程序 在 
读 取 多 个 输出 数据 块 时 能 够 正常 工作 ， 你 可 以 尝试 每 次 读 取 少 于 
BUFSIZ 个 字符 〈 比 如 BUFSIZE/10 个 字符 ) 。 


13.3.2 如何 实现 popen 


请 求 popen 调 用 运行 一 个 程序 时 ， 它 首先 启动 shell， 即 系统 中 的 sh 
命令 ， 然 后 将 command 字 符 串 作为 一 个 参数 传递 给 它 。 这 有 两 个 效果 ， 
=a PAA 

在 Linux (以 及 所 有 的 类 UNIX 系 统 ) 中 ， 所 有 的 参数 扩展 都 是 由 
shell 来 完成 的 。 所 以 ， 在 启动 程序 之 前 先 启动 shell 来 分 析 命 令 字 符 串 ， 


就 可 以 使 各 种 shell 扩 展 ( 如 *.c 所 指 的 是 哪些 文件 ) 在 程序 局 动 之 前 就 全 
部 完成 。 这 个 功能 非常 有 用 ， 它 允许 我 们 通过 popen 启 动 非常 复杂 的 
shell 命 令 。 而 其 他 一 些 创建 进程 的 水 数 〈( 如 exed) 调用 起 来 束 复 杂 得 
多 ， 因 为 调用 进程 必须 自己 去 完成 shell 扩 展 。 

使 用 shell 的 一 个 不 太 好 的 影响 是 ， 针 对 每 个 popen 调 用 ， 不 仅 要 启 
动 一 个 被 请 求 的 程序 ， 还 要 启动 一 个 shell， 即 每 个 popen 调 用 将 多 启动 
两 个 进程 。 从 节省 系统 资源 的 角度 来 看 ，popen 函 数 的 调用 成 本 略 高 ， 
而 且 对 目标 命令 的 调用 比 正常 方式 要 慢 一 些 。 

我 们 用 程序 popen4.c 来 演示 popen 函 数 的 行为 。 这 个 程序 对 所 有 
popen 示 例 程 序 的 源 文件 的 总 行 数 进行 统计 ， 方 法 是 用 cat 命 令 显 示 文 件 
的 内 容 并 将 输出 通过 管道 传递 给 命令 wc-1， 由 后 者 统计 总 行 数 。 如 果 是 
在 命令 行 上 完成 这 一 任务 ， 我 们 可 以 使 用 如 下 命令 : 


$ cat popen* .c | wc -1 


事实 上 ， 输 入 命令 wc -1 popen*.c 更 简单 而 且 更 有 效率 ， 但 我 们 
是 为 了 通过 这 个 例子 来 演示 popen 函 数 的 工作 原理 。 


SX 验 popen 启 动 Shell 
这 个 程序 使 用 上 面 给 出 的 命令 ， 但 是 通过 popen 来 读 取 命 令 输出 的 
结果 : 


运行 这 个 程序 时 ， 我 们 将 看 到 如 下 所 示 的 输出 结果 : 


$ ./popen4 
Reading: - 
94 
实验 解析 
这 个 程序 显示 ，shell 在 启动 后 将 popen*.c 扩 展 为 一 个 文件 列表 ， 列 
表 中 的 文件 名 都 以 popen 开 头 ， 以 .c 结 尾 ，shell 还 处 理 了 管道 符 (|) 并 
将 cat 命 令 的 输出 传递 给 wc 命令 。 我 们 在 一 个 popen 调 用 中 启动 了 shell、 
cat 程 序 和 wc 程 序 ， 并 进行 了 一 次 输出 重 定 向 。 而 调用 这 些 命令 的 程序 
只 看 到 最 终 的 输出 结果 。 


在 看 过 高 级 的 popen 函 数 之 后 ， 我 们 再 来 看 看 底层 的 pipe 函 数 。 通 过 
这 个 函数 在 两 个 程序 之 间 传 递 数据 不 需要 启动 一 个 shell 来 解释 请 求 的 命 
令 。 它 同时 还 提供 了 对 读 写 数 据 的 更 多 控制 。 

pipe 函 数 的 原型 如 下 所 示 ; 


#include <unistd.h> 


int pipe(int file _descriptor[2]); 


pipe K ACH) Až — A SE SS I FF ZB ZB 
指针 。 该 函数 在 数组 中 填 上 两 个 新 的 文件 描述 符 后 返回 0， 如 果 失 败 则 
返回 - 1 并 设置 ermo 米 表明 失败 的 原因 。 在 Linux 手 册页 (手册 的 第 二 部 
分 ) 中 定义 了 下 面 一 些 错误 。 

O EMFILE: 进程 使 用 的 文件 描述 符 过 多 。 

O ENFILE: 系统 的 文件 表 已 满 。 

O EFAULT: 文件 描述 符 无 效 。 

两 个 返回 的 文件 描述 符 以 一 种 特殊 的 方式 连接 起 来 。 写 到 
file_descriptor[1] 的 所 有 数据 都 可 以 从 fe_descriptor[0] 读 回来 。 数 据 基 于 
先进 先 出 的 原则 (通常 简写 为 FIFO〉 进 行 处 理 ， te 
1，2，3 写 到 file_descriptor[1]， 从 file ee ee 
oe 3。 这 与 栈 的 处 理 方 式 不 同 ， 栈 采用 后 进 先 出 的 原则 ， 通常 简写 
为 LIFO。 


特别 要 注意 ， 这 里 使 用 的 是 文件 描述 符 而 不 是 文件 流 ， 所 以 我 
们 必须 用 底层 的 read 和 write 调用 来 访问 数据 ， 而 不 是 用 文件 流 库 函 
数 fread 和 fwrite。 


下 面 的 程序 pipel.c 用 pipe 函 数 来 创建 一 个 管道 。 


S 验 piperk 2 
注意 fe_pipes 数 组 的 用 法 ， 它 的 地 址 被 当 作 参数 传递 给 pipe 函 数 。 


_process wri tilep ), some_data s data) 
£(*Wro b da ed); 
d „processed = difile pipes(0 buffer, BUPSIZ 
p £(*Read td bytes: ts\n*, p ssed 
EXIT_SUCCESS) ; 
) 
exit IT_FAILURE 


运行 这 个 程序 时 ， 输 出 结果 如 下 所 示 : 
>» ./pipel 


Wrote 3 bytes 
Read 3 bytes: 123 


实验 解析 

这 个 程序 用 数组 file_pipes[] 中 的 两 个 文件 摘 述 符 创 建 一 个 管道 。 然 
后 它 用 文件 描述 符 file_pipes[ 了 H] 同 管道 中 写 数 据 ， 再 从 file_pipes[0] 读 回 
注意 ， 管 道 有 一 些 内 置 的 缓存 区 ， 它 在 write 和 read 调 用 之 间 保 存 
数据 

如 果 你 尝试 用 file_descriptor[0] 写 数据 或 用 file_descriptor[1] 读 数据 ， 
其 后 果 并 未 在 文档 中 明确 定义 ， 所 以 其 行为 可 能 会 非常 奇怪 ， 并 且 随 着 
系统 的 不 同 ， 其 行为 可 能 会 发 生变 化 。 在 我 的 系统 上 ， 这 样 的 调用 将 失 
败 并 返回 -1， 这 人 至少 能 够 说 明 这 种 错误 比较 容易 发 现 。 

乍 看 起 来 ， 这 个 使 用 管道 的 例子 并 无 特别 之 处 ， 它 做 的 工作 也 可 以 
用 一 个 简单 的 文件 完成 。 管 道 的 真正 优势 体现 在 ， 当 你 想 在 两 个 进程 之 
间 传 递 数 据 的 时 候 。 我 们 在 第 12 章 讲 过 ， 当 程序 用 fork 调 用 创建 新 进程 
时 ， 原 先 打 开 的 文件 描述 符 仍 将 保持 打开 状态 。 如 果 在 原先 的 进程 中 创 
建 一 个 管道 ， 然 后 再 调用 fork 创 建新 进程 ， 我 们 即 可 通过 管道 在 两 个 进 
程 之 间 传 递 数据 。 


实 验 跨越 fork 调 用 的 管道 


(1) 下 面 这 个 程序 pipe2.c 的 开始 部 分 “在 调用 fork 之 前 的 部 分 》 和 
第 一 个 例子 非常 相似 。 


include <unistd.h> 
Sinclude <stdlib.h> 
Sinclude <stdio.h> 

include <string.h> 


int main( 
{ 
int data_processed; 
int file pipes[2); 
const char some_data{) = °123"; 
char buffer(BUFSIZ + 1); 
pid_t fork_result; 


memset (buffer, ‘\0', sizeof(buffer)); 


if (pipe(file_pipes) == 0) { 
fork_result = fork(); 
if (fork_result == -1i) { 


fprintf(stderr, "Fork failure’); 
exit (EXIT_FAILURE) ; 
} 


(2) 在 确认 fork 调 用 成 功 后 ， 如 果 fork_result 等 于 零 ， 束 说 明 我 们 
是 在 子 进程 中 ， 如 下 所 示 : 


if (fork_ result == 0) { 
data_processed = read({file pipes(0}], buffer, BUFSIZ); 
printf ("Read td bytes: %s\n", data_processed, buffer); 
exit (EXIT_SUCCESS) ; 


a, BUNA EER, OR TAN 
(3) Aull, RIJE EEE, OR Atm: 
else { 
data_processed = write(file_pipes[1), some_data, 
strlen(some_data) }; 
printf (*Wrote td bytes\n", data_processed); 
} 
) 
exit (EXIT_SUCCESS); 
} 


运行 这 个 程序 时 ， 输 出 结果 和 前 例 一 样 : 

S ./pipe2 

Wrote 3 bytes 
Read 3 bytes: 123 


你 可 能 会 在 实际 运行 这 个 程序 的 时 候 发 现 ， 命 令 提示 符 在 输出 结 
的 最 后 一 行 之 前 出 现 ， 为 了 便于 阅读 ， 我 们 在 这 里 对 输出 结果 进行 了 调 
整 。 


实验 解析 


这 个 程序 首先 用 pipe 调 用 创建 一 个 管道 ， 接 着 用 fork 调 用 创建 一 个 
新 进程 。 如 果 fork 调 用 成 功 ， 父 进程 就 写 数据 到 管道 中 ， 而 子 进程 从 管 
道中 读 取 数据 。 父子 进程 都 在 只 调用 了 一 次 write 或 read 之 后 就 退出 。 如 


有 果 父 进 程 在 子 进程 之 前 退出 ， 你 就 会 在 两 部 分 输出 内 容 之 间 看 到 shell 提 
示 符 。 


虽然 从 表面 上 看 ， 这 个 程序 和 第 一 个 使 用 管道 的 例子 很 相似 ， 但 实 


际 上 在 这 个 例子 中 我 们 往 前 路 出 了 一 大 步 ， 我 们 可 以 在 不 同 的 进程 之 间 
进行 读 写 操作 了 ， 如 图 13-2 所 示 。 


file_pipes[1] file_pipes[0] 


Z $ N f Bi 
| 父 进程 —_— ene rN ) 
‘ie A 


A/ 


13.5 KHIEN THT 


在 接 下 来 的 对 pipe 调 用 的 研究 中 ， 我 们 将 学 习 如 何在 子 进程 中 运行 
一 个 与 其 父 进程 完全 不 同 的 另外 一 个 程序 ， 而 不 是 仅仅 运行 一 个 相同 程 
序 。 我 们 用 exec 调 用 来 完成 这 一 工作 。 这 里 的 一 个 难点 是 ， 通 过 exec 调 
用 的 进程 需要 知道 应 该 访问 哪个 文件 描述 符 。 在 前 面 的 例子 中 ， 因 为 子 
进程 本 身 有 file_pipes 数 据 的 一 份 副本 ， 上 所 以 这 并 不 成 为 问题 。 但 经 过 
exec 调 用 后 ， 情 况 束 不 一 样 了 ， 因 为 原先 的 进程 已 经 被 新 的 子 进 程 丛 换 
了 。 为 解决 这 个 问题 ， 我 们 可 以 将 文件 搬 述 符 〈 它 实际 上 只 是 一 个 数 
F) 作为 一 个 参数 传递 给 用 exec 局 动 的 程序 。 

为 了 演示 它 是 如 何 工作 的 ， 我 们 需要 使 用 两 个 程序 。 第 一 个 程序 是 
数据 生产 者 ， 它 负责 创建 管道 和 局 动 子 进程 ， 而 后 者 是 数据 消费 者 。 


实 验 EP TE Allexec pk AV 
(1) 下 面 这 个 程序 pipe3.c 是 从 pipe2.c 修 改 而 来 。 我 们 在 改动 的 地 
方 加 上 了 阴影 ， 如 下 所 示 : 


int mair 


(2) 数据 消费 者 程序 pipe4.c 负 责 读 取 数 据 ， 它 的 代码 要 简单 得 


要 记 住 ，pipe3 在 程序 中 调用 pipe4， 运 行 pipe3 时 ， 我 们 将 看 到 如 下 
所 示 的 输出 结果 : 

$ ./pipe3 

22460 - wrote 3 bytes 

22461 - read 3 bytes: 123 


实验 解析 

pipe3 程 序 的 开始 部 分 和 前 面 的 例子 一 样 ， 用 pipe 调 用 创建 一 个 管 
道 ， 然 后 用 fork 调 用 创建 一 个 新 进程 。 接 下 来 ， 它 用 sprintf 把 读 取 管道 
数据 的 文件 描述 符 保 存 到 一 个 缓存 区 中 ， 该 缓存 区 中 的 内 容 将 构成 
pipe4 程 序 的 一 个 参数 。 

我 们 通过 execl 调 用 来 启动 pipe4 程 序 ，execl 的 参数 如 下 所 示 。 

口 要 启动 的 程序 。 

口 argv[0]: 程序 名 。 

O argv[1]: 包含 我 们 想 让 被 调用 程序 去 读 取 的 文件 描述 符 。 

口 (char*) 0: 这 个 参数 的 作用 是 终止 被 调用 程序 的 参数 列表 。 

pipe4 程 序 从 参数 字符 串 中 提取 出 文件 描述 符 数字 ， 然 后 读 取 该 文 
件 描述 符 来 获取 数据 。 


在 继续 学 习 之 前 ， 我 们 再 来 仔细 研究 一 下 打开 的 文件 描述 符 。 至 
此 ， 我 们 一 直 采 取 的 是 让 读 进程 读 取 一 些 数据 然后 直接 退出 的 方式 ， 并 


假设 Linux 会 把 清理 文件 当 作 征 在 进程 结束 时 应 该 做 的 工作 的 
一 部 分 。 

但 大 多 数 从 标准 输入 读 取 数据 的 程序 采用 的 却 是 与 我 们 到 目前 为 止 
见 到 的 例子 非常 不 同 的 另外 一 种 做 法 。 通 常 它们 并 不 知道 有 多 少数 据 需 
要 读 取 ， 所 以 往往 采用 循环 的 方法 ， 读 取 数 据 一 一 处 理 数 据 一 一 读 取 更 
多 的 数据 ， 直 到 没有 数据 可 读 为 止 。 

当 没 有 数据 可 读 时 ，read 调 用 通常 会 阻塞 ， 即 它 将 暂停 进程 来 等 待 
直到 有 数据 到 达 为 止 。 如 果 管 道 的 另 一 端 已 被 关闭 ， 也 就 是 说 ， 没 有 进 
程 打开 这 个 管道 并 向 它 写 数据 了 ， 这 时 read 调 用 就 会 阻塞 。 但 这 样 的 阻 
塞 不 是 很 有 用 ， 因 此 对 一 个 已 关闭 写 数据 的 管道 做 read 调 用 将 返回 0 而 
不 是 阻塞 。 这 就 使 读 进 程 能 够 像 检 测 文件 结束 一 样 ， 对 管道 进行 检测 并 
作出 相应 的 动作 。 注 意 ， 这 与 读 取 一 个 无 效 的 文件 描述 符 不 同 ，read 拒 
无 效 的 文件 描述 符 看 作 一 个 错误 并 返回 -1。 

如 果 跨 越 fork 调 用 使 用 管道 ， 就 会 有 两 个 不 同 的 文件 描述 符 可 以 用 
于 同 管道 写 数据 ， 一 个 在 父 进程 中 ， 一 个 在 子 进程 中 。 只 有 把 父子 进程 
中 的 针对 管道 的 写 文件 描述 符 都 关闭 ， 管 道 才 会 被 认为 是 关闭 了 ， 对 管 
道 的 read 调 用 才 会 失败 。 我 们 还 将 深入 讨论 这 一 问题 ， 在 学 习 到 
O_NONBLOCK 标 志和 FIFO 时 ， 我 们 将 看 到 一 个 这 样 的 例子 。 


现在 ， 我 们 已 知道 了 如 何 使 得 对 一 个 空 管道 的 读 操作 失败 ， 下 面 我 
们 来 看 一 种 用 管道 连接 两 个 进程 的 更 简洁 的 方法 。 我 们 把 其 中 一 个 管道 
文件 描述 符 设 置 为 一 个 已 知 值 ， 一 般 是 标准 输入 0 或 标准 输出 1。 在 父 进 
程 中 做 这 个 设置 稍微 有 点 复杂 ， 但 它 使 得 子 程序 的 编写 变 得 非常 简单 。 

这 样 做 的 最 大 好 处 是 我 们 可 以 调用 标准 程序 ， 即 那些 不 需要 以 文件 
描述 符 为 参数 的 程序 。 为 了 完成 这 个 工作 ， 我 们 需要 使 用 在 第 3 章 中 介 
绍 过 的 dup 函 数 。dup 函 数 有 两 个 罕 密 关联 的 版 本 ， 它 们 的 原型 如 下 所 
ZN: 


#include <unistd.h> 


int dup(int file_descriptor); 
int dup2(int file_descriptor_one, int file_descriptor_two); 


dup 调 用 的 目的 是 打开 一 个 新 的 文件 描述 符 ， 这 与 open 调 用 有 点 类 
似 。 不 同 之 处 是 ，dup 调 用 创建 的 新 文件 描述 符 与 作为 它 的 参数 的 那个 
己 有 文件 描述 符 指向 同一 个 文件 (或 管道 ) 。 对 于 dup 函 数 来 说 ， 新 的 
文件 描述 符 总 是 取 最 小 的 可 用 值 。 而 对 于 dup2 函 数 来 说 ， 它 所 创建 的 新 
文件 描述 符 或 者 与 参数 fle_descriptor_two 相 同 ， 或 者 是 第 一 个 大 于 该 参 


数 的 可 用 值 。 


我 们 可 以 使 用 更 通用 的 fcnt1 调 用 (command SAREAN 
F_DUPFD) 来 达到 与 调用 dup 和 dup2 相 同 的 效果 。 虽 然 如 此 ， 但 
dup 调 用 更 易于 使 用 ， 因 为 它 是 专门 用 于 复制 文件 描述 符 的 。 而 且 
它 的 使 用 非常 普遍 ， 你 可 以 发 现 ， 在 已 有 的 程序 中 ， 它 的 使 用 比 
fcnt1 和 F_DUPFD 更 频繁 。 


那么 ， dupe iTi MARNIE 进程 之 间 传 递 数据 的 呢 ? RIRE 

， 标 准 输入 的 文件 描述 符 总 是 0(， 而 dup 返 回 的 新 的 文件 描述 符 又 总 
fe eee 的 数字 。 因 此 ， 如 果 我 们 首先 关闭 文件 描述 
dup， 那么 新 的 文件 描述 符 就 将 是 数字 0。 因 为 新 的 文件 换 述 符 是 复制 一 
个 已 有 的 文件 描述 符 ， 所 以 标准 输入 束 会 改 为 指 PE 
函数 的 文件 描述 符 所 对 应 的 文件 或 管道 。 我 们 创建 了 两 个 文件 摘 述 
它们 指向 同一 个 文件 或 管道 ， 而 且 其 中 之 一 是 标准 输入 。 

用 close 和 dup 函 数 对 文件 描述 符 进 行 处 理 

理解 当 我 们 关闭 文件 描述 符 0， 然 后 调用 dup 究 竟 发 生 了 什么 的 最 简 
单 的 方法 束 是 ， 查 看 开头 的 4 个 文件 摘 述 符 的 状态 在 这 一 过 程 中 的 改变 
情况 ， 如 表 13-1 所 示 。 


表 13-1 
Rew EE 值 美 闭 六 和 忻 描述 符 0 后 up 调用 后 
0 准 输入 CRA 花道 文件 撕 述 符 
AE RH ER! a 
we wah 
1 1 f 


X 验 PT Al dupes 2 

FRE SATA PI, (AY, FRADE RE? WY stdin t HI AF PF 
换 为 我 们 创建 的 管道 的 读 取 端 。 我 们 还 将 对 文件 描述 符 做 一 些 清理 ， 使 
得 子 程序 可 以 正确 检测 到 管 道中 数据 的 吉 束 。 与 往常 一 样 ， 为 了 简洁 起 
见 ， 我 们 省 略 了 一 些 错误 检查 。 

用 如 下 的 代码 将 pipe3.c 修 改 为 pipe5.c: 


a pr 
ile_pipes[2] 
char s atal 1 
rk 
for) 
t = dt)- 
r ier Pork u 
FAILURE) ; 


£ {fork resul 
close(0); 
dup (file_pipes[0})}; 
close (file_pipes[0]); 
close(file_pipes[1]); 


e.~ase 
close (file_pipes[0}); 
data_processed = write(file_p 


pipes[i]); 
wrote %G bytes\n", (int)getpid(), data_processed) 


这 个 程序 的 输出 结果 如 下 所 示 : 


$ ./pipe5 

22495 - wrote 3 bytes 
0000000 1 2 3 
0000003 


实验 解析 

与 往常 一 样 ， 这 个 程序 创建 一 个 管道 ， 然 后 通过 fork 创 建 一 个 子 进 
程 。 此 时 ， 父 子 进程 都 有 可 以 访问 管道 的 文件 描述 符 ， 一 个 用 于 读数 
据 ， 一 个 用 于 写 数据 ， 所 以 总 共有 4 个 打开 的 文件 描述 符 。 

我 们 首先 来 看 子 进程 。 子 进程 先 用 close (0) 关闭 它 的 标准 输入 ， 
然后 调用 dup (file_pipes[0]) 把 与 管道 的 读 取 端 关联 的 文件 描述 符 复制 
为 文件 描述 符 0， 印 标准 输入 。 接 下 来 ， 子 进程 关闭 原先 的 用 来 从 管道 


读 取 数 据 的 文件 描述 符 包 e_pipes[0]。 因 为 子 进程 不 会 向 管道 写 数据 ， 所 
以 它 把 与 管道 关联 的 写 操作 文件 描述 符 file_pipes[1] 也 关闭 了 。 现 在 ， 它 
只 有 一 个 与 管道 关联 的 文件 描述 符 ， 即 文件 描述 符 0， 它 的 标准 输入 。 
接 下 来 ， 子 进程 就 可 以 用 exec 来 局 动 任何 从 标准 输入 读 取 数 据 的 程 
序 了 。 在 本 例 中 ， 我 们 使 用 的 是 od 命 令 。od 命 令 将 等 竺 数据 的 到 来 ， 就 
好 像 它 在 等 得 来 目 用 户 终 端的 输入 一 样 。 事 实 上 ， 如 末 没 有 明确 使 用 检 


是 来 自 一 个 终端 。 

父 进程 首先 关闭 管道 的 读 取 端 fle_pipes[0]， 因 为 它 不 会 从 管道 读 取 
数据 。 接 着 它 回 管道 写 入 数据 。 当 所 有 数据 都 写 完 后 ， 父 进程 关闭 管道 
的 写 入 端 并 退出 。 因 为 现在 已 没有 打开 的 文件 摘 述 符 可 以 同 管 道 写 数据 
了 ，od 程 序 读 取 写 到 管道 中 的 3 个 字 市 数据 后 ， 后 续 的 读 操作 将 返回 0 字 
节 ， 表 示 已 到 达 文 件 尾 。 当 读 操作 返回 0 时 ，od 程 序 束 退出 运行 。 这 类 
似 于 在 终端 上 运行 od 命 令 ， 然 后 按 下 Ctrl+D 组 合 键 发送 文 件 尾 标志 。 

图 13-3 显 示 调 用 pipe 之 后 的 情况 。 
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图 13-4 显 示 调 用 fork 之 后 的 情况 。 
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图 13-4 


图 13-5 显 示 程 序 做 好 数据 传输 准备 之 后 的 情况 。 


13.6 MAES: FIFO 


至 此 ， 我 们 还 只 能 在 相关 的 程序 之 间 传 递 数据 ， 即 这 些 程序 是 由 一 
个 共同 的 祖先 进程 启动 的 。 但 如 果 我 们 想 在 不 相关 的 进程 之 间 交 换 数 
据 ， 这 还 不 是 很 方便 。 

我 们 可 以 用 FIFO 文 件 来 完成 这 项 工作 ， 它 通常 也 被 称 为 命名 管道 
(named pipe) 。 命 名 管道 是 一 种 特殊 类 型 的 文件 〈 列 二 了 Linux 中 的 所 
有 事物 都 是 文件 ) ， 它 在 文件 系统 中 以 文件 名 的 形式 存在 ， 但 它 的 行为 
却 和 我 们 已 经 见 过 的 没有 名 字 的 管道 类 似 。 

我 们 可 以 在 命令 行 上 创建 命名 管道 ， 也 可 以 在 程序 中 创建 它 。 过 
去 ， 命 令 行 上 用 来 创建 命名 管道 的 程序 是 mknod， 如 下 所 示 : 

$ mknod filename p 

但 mknod 命 令 并 未 出 现在 X/Open 规范 的 命令 列表 中 ， 所 以 可 能 并 不 
是 所 有 的 类 UNIX 系 统 都 可 以 这 样 做 。 我 们 推荐 使 用 的 命令 行 命令 是 : 


$ mkfifo filename 


有 些 老 版 本 的 UNIX 系 统 只 有 mknod 命 令 。X/Open 规 范 的 第 4 期 
第 2 版 中 有 mknod 孙 数 调用 ， 但 没有 对 应 的 命令 行程 序 。Linux 系 统 
非常 友好 ， 它 同时 支持 mknod 和 mkfifo。 


在 程序 中 ， 我 们 可 以 使 用 两 个 不 同 的 函数 调用 ， 如 下 所 示 : 


#include <sys/types.h> 
#include <sys/stat.h> 


int mkfifo(const char *filename, mode_t mode); 
int mknod(const char *filename, mode_t mode | S_IFIFO, (dev_t) 0); 


与 nknod 命 令 一 样 ， 我 们 可 以 用 mknod 函 数 建立 许多 特殊 类 型 的 文 
件 。 要 想 通 过 这 个 函数 创建 一 个 命名 管道 ， 唯 一 具有 可 移植 性 的 方法 是 
使 用 一 个 dev_t 类 型 的 值 0， 并 将 文件 访问 模式 与 5_IFIFO 按 位 或 。 我 们 
在 下 面 的 例子 中 将 使 用 较 简 单 的 mkfifo 函 数 。 


实 验 创建 命名 管道 
下 面 是 程序 fifol.c 的 代码 : 


一 
bo bee pa bee be 
S B p-e 
pa pa u 

& & & & 
2666 

oo @ @ 

~ 

人 
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if (res we 0) prir 
exit (EXIT SUCCESS); 


我 们 可 以 用 下 面 的 命令 来 创建 和 查找 管道 


注意 ， 输出 结果 中 的 第 一 上 字符 为 p， 表示 这 是 个 管道 。 最 后 的 | 
符号 是 由 TI 命令 的 -F 选 项 添加 的 ， 它 也 表示 这 是 一 个 管道 。 

实验 解析 

这 个 程序 用 mkfifo 函 数 创 建 一 个 特殊 的 文件 。 虽 然 我 们 要 求 的 文件 
模式 是 0777， 但 它 被 用 户 掩 码 Cumask) 设置 〈 在 本 例 中 是 022) 给 改变 
了 ， 这 与 普通 文件 的 创建 是 一 样 的 ， 所 以 文件 的 最 终 模式 是 755。 如 果 
你 的 撼 码 设置 与 这 里 不 同 ， 比 如 是 0002， 那 你 将 看 到 创建 的 文件 拥有 一 
个 不 同 的 权限 。 

我 们 可 以 像 删除 一 个 
也 可 以 在 程序 中 用 mmlink 系 统 调用 来 删除 


13.6.1 访问 FIFO、 


命名 管道 的 一 个 非常 有 用 的 特点 是 ， 由 于 它们 出 现在 文件 系统 中 ， 
所 以 它们 可 以 像 平常 的 文件 名 一 样 在 命令 中 使 用 。 在 把 创建 的 FIFO 文 件 
用 在 程序 设计 中 之 前 ， 我 们 先 通过 普通 的 文件 合 信 来 观 府 FIFO 文 人 
行 关 


实 验 访问 FIFO 文 件 
(1) 首先 ， 我 们 来 尝试 读 这 个 ( 空 的 ) FIFO 文 件 : 
$ cat </tmp/my_fifo 
(2) 现在 ， 党 试 回 FIFO 写 数据 。 你 必须 用 另 一 个 终端 来 执行 下 面 
的 命令 ， 因 为 第 一 个 命令 现在 被 挂 起 以 等 待 数据 出 现在 FIFO 中 。 
$ echo “Hello World ”> /tmp/my_fifo 
你 将 看 到 cat 命 令 产 生 输 出 。 如 末 不 向 FIFO 发 送 任何 数据 ，cat 命 令 
将 一 直 挂 起 ， 直 到 你 中 断 它 ， 第 用 的 中 断 方 式 是 使 用 组 合 键 Ctrl+C。 


(3) 我 们 可 以 将 第 一 个 命令 放 在 后 台 执 行 ， 这 样 即 可 一 次 执行 两 
个 命令 ， 
$ cat < /tmp/my_fifo & 
AE 1316 
$ echo "Hello World" > /tmp/my_fifo 
Hello World 


[1]+ Done cat </tmp/my_fifo 


实验 解析 

因为 FIFO 中 没有 数据 ， 所 以 cat 和 echo 程 序 都 阻塞 了 ，cat 等 待 数 据 
的 到 来 ， 而 echo 等 待 其 他 进程 读 取 数 据 。 

在 上 面 的 第 三 步 中 ，cat 进 程 一 开始 就 在 后 台 被 阻塞 了 ， 当 echo 问 它 
提供 了 一 些 数据 后 ，cat 命 令 读 取 这 些 数 据 并 把 它们 打印 到 标准 输出 上 ， 
然后 cat 程 序 退 出 ， 不 再 等 待 更 多 的 数据 。 它 没有 阻塞 是 因为 当 第 二 个 命 
令 将 数据 放 入 FIFO 后 ， 管 道 将 被 关闭 ， 所 以 cat 程 序 中 的 read 调 用 返回 0 
字 节 ， 表 示 已 经 到 达 文 件 尾 。 

现在 我 们 已 看 过 用 命令 行程 序 访 问 FIFO 的 情况 ， 接 下 来 我 们 将 仔细 
ee eras 它 可 以 让 我 们 在 访问 FIFO 文 件 时 更 多 地 控制 其 
读 写 行为 。 


与 通过 pipe 调 用 创建 管道 不 同 ，FIFO 是 以 命名 文件 的 形式 存 
在 ， 而 不 是 打开 的 文件 描述 符 ， 所 以 在 对 它 进行 读 写 操作 之 前 必须 
先 打开 它 。FIFO 也 用 open 和 close 函 数 打开 和 关闭 ， 这 与 我 们 前 面 看 
到 的 对 文件 的 操作 一 样 ， 但 它 多 了 一 些 其 他 的 功能 。 对 FIFO 来 说 ， 
传递 给 open 调 用 的 是 FIFO 的 路 径 名 ， 而 不 是 一 个 正常 的 文件 。 


1. 使 用 open 打 开 FIFO 文 件 

打开 FIFO 的 一 个 主要 限制 是 ， 程 序 不 能 以 O_RDWR 模式 打开 FIFO 
文件 进行 读 写 操作 ， 这 样 做 的 后 果 并 未 明确 定义 。 但 这 个 限制 是 有 道理 
的 ， 因 为 我 们 通常 使 用 FIFO 只 是 为 了 单 癌 传递 数据 ， 所 以 没有 必要 使 用 
O_RDWR 模 式 。 如 果 一 个 管道 以 读 / 写 方式 打开 ， 进 程 就 会 从 这 个 管道 
读 回 它 自己 的 输出 。 

如 果 确 实 需 要 在 程序 之 间 双 辣 传 递 数 据 ， 最 好 使 用 一 对 FIFO 或 管 
道 ， 一 个 方向 使 用 一 个 ， 或 者 (但 并 不 常用 ) 采用 先 关 闭 再 重新 打开 
FIFO 的 方法 来 明确 地 改变 数据 流 的 方向 。 我 们 将 在 本 章 后 面部 分 再 讨论 
用 FIFO 进 行 双 回 数据 交换 的 问题 。 


打开 FIFO 文 件 和 打开 普通 文件 的 另 一 点 区 别 是 ， 对 open_flag Copen 
函数 的 第 二 个 参数 ) 的 O NONBLOCK 选 项 的 用 法 。 使 用 这 个 选项 不 仅 
改变 open 调 用 的 处 理 方式 ， 还 会 改变 对 这 次 open 调 用 返回 的 文件 描述 符 
进行 的 读 写 请 求 的 处 理 方式 。 

O_RDONLY、O_WRONLY 和 O_NONBLOCK 标 志 共 有 4 种 合法 的 
组 合 方式 ， 我 们 将 逐个 介绍 它们 。 

open (const char *path,O_ RDONLY) ; 

在 这 种 情况 下 ，open 调 用 将 阻 窟 ， 除 非 有 一 个 进程 以 写 方式 打开 同 
一 个 FIFO， 人 和 否则 它 不 会 返回 。 这 与 前 面 第 一 个 cat 命 令 的 例子 类 似 。 

open (const char *path, O_RDONLY | O_NONBLOCK ) ; 

即使 没有 其 他 进程 以 写 方式 打开 FIFO， 这 个 open 调 用 也 将 成 功 并 立 
刻 返 回 。 
open (const char *path,O_WRONLY ) ; 

在 这 种 情况 下 ，open 调 用 将 阻塞 ， 直 到 有 一 个 进程 以 读 方 式 打开 同 
一 个 FIFO 为 止 。 

open (const char *path,O_WRONLY | O_NONBLOCK ) ; 

这 个 函数 调用 总 是 立刻 返回 ， 但 如 果 没 有 进程 以 读 方式 打开 FIFO 文 
件 ，open 调 用 将 返回 一 个 错误 -1 并 且 FIFO 也 不 会 被 打开 。 如 果 确 实 有 一 
个 进程 以 读 方 式 打开 FIFO 文 件 ， 那 么 我 们 就 可 以 通过 它 返 回 的 文件 描述 
符 对 这 个 FIFO 文 件 进行 写 操作 。 


请 注意 O_NONBLOCK 分 别 搭配 O_RDONLY 和 O_WRONLY 在 
效果 上 的 不 同 ， 如 果 没 有 进程 以 读 方式 打开 管道 ， 非 阻塞 写 方式 的 
open 调 用 将 失败 ， 但 非 阻塞 读 方式 的 open 调 用 总 是 成 功 。close 调 用 
的 行为 并 不 受 O_NONBLOCK 标 志 的 影响 。 


X 验 打开 FIFO 文 件 

下 面 我 们 来 看 ， 如 何 通 过 使 用 带 0_NONBLOCK 标 志 的 open 调 用 的 
行为 来 同步 两 个 进程 。 我 们 在 这 里 并 没有 选择 使 用 多 个 示例 程序 的 做 
法 ， 而 是 只 使 用 一 个 测试 程序 fifo2.c， 通 过 给 该 程序 传递 不 同 的 参数 的 
方法 来 观察 FIFO 的 行为 。 

(1) 程序 的 开始 部 分 是 头 文件 和 #define 定 义 ， 然 后 检查 是 否 在 命 
令 行 提供 了 正确 数目 的 参数 : 


<stdlib.h> 
e <stdio.h> 
<str g.h> 


if arg 


(2) 假设 程序 已 通 过 测试 ， 现 在 我 们 根据 命令 行 参数 来 设置 
open_mode 的 值 : 


(3) 现在 检查 FIFO 文 件 是 否 存 在 ， 如 有 必要 就 创建 它 。 接 下 来 打 
开 这 个 FIFO 文 件 并 输出 相应 的 信息 ， 然 后 程序 小 怠 一 下 。 最 后 ， 关 闭 
FIFO. 


实验 解析 

这 个 程序 能 够 在 命令 行 上 指定 我 们 希望 使 用 的 O RDONLY、 
O_WRONLY 和 O_NONBLOCK 的 组 合 方 式 。 它 会 把 命令 行 参数 与 程序 
a 量 字符 串 进行 比较 ， 如 果 [ 匹 配 ， 就 (用 |= 操 作 符 〉 设置 相应 的 标 
ite o Pere access pki BK Re FIFO XE EE, WRA AFERE E 
Kio 

在 程序 中 ， 一 直到 最 后 都 没有 删除 这 个 FIFO 文 件 ， 因 为 我 们 没 办 法 
知道 是 否 有 其 他 程序 正在 使 用 它 。 


2. 不 带 O_NONBLOCK 标 志 的 O_RDONLY 和 0 一 WRONLY 


rd ri mm mm ra mm 
TEETE 


我 们 现在 有 了 测试 程序 ， 可 以 逐个 尝试 标志 的 不 同 组 合 方式 。 注 
蕊 ， 我 们 将 第 一 个 程序 ( 读 取 者 〉 放 在 后 台 运 行 


$ ./£if02 O RDONLY & 

fa] 252 

Process 152 opening FIFO 
$ ./£if02 O WRONLY 
Process 153 opening FIFO 
Process 152 result 3 
Process 153 result 3 
Process 152 finished 
Process 153 finished 


这 可 能 是 命名 管道 最 常见 的 用 法 了 。 它 允许 先 启 动 读 进程 ， 并 
在 open 调 用 中 等 待 ， 当 第 二 个 程序 打开 FIFO 文 件 时 ， 两 个 程序 继续 


运行 。 注 意 ， 读 进程 和 写 进 程 在 open 调 用 处 取得 同步 。 


当 一 个 Linux 进 程 被 阻 窟 时 ， 它 并 不 消耗 CPU 资 源 ， 所 以 这 种 


进程 的 同步 方式 对 CPU 来 说 是 非常 有 效率 的 。 


3. 带 O_NONBLOCK 标 志 的 O RDONLY 和 不 带 该 标志 的 
O_WRONLY 


这 次 ， 读 进程 执行 open 调 用 并 立刻 继续 执行 ， 即 使 没有 写 进 程 的 存 
在 。 随 后 写 进程 开始 执行 ， 它 也 在 执行 open 调 用 后 立刻 继续 执行 ， 但 这 
ot a Lah 


fee O_RDONLY O_NONBLOCK & 


cess n , opening mm 


fifo2 o WRONLY 


rocess 161 opening 


? 


es < 160 seyit 
cess 160 result 


oD re 
DL 上 


rocess 160 finished 


Process 16 


J AVA 和 SiT 


RDON NONBLOCK 


You 


“这 两 个 例子 可 能 是 open 模 起 的 最 常见 的 组 全 形式 。 你 还 


不 可 以 用 这 个 


示例 程序 随意 尝试 其 他 组 合 方式 。 
4. 对 FIFO 进 行 读 写 操作 


使 用 O_NONBLOCK 横 式 会 影响 到 对 FIFO 的 read 和 write 调用 。 

对 一 个 空 鸭 、 阻 塞 的 FIFO 〈 即 没有 用 O_NONBLOCK 标 志 打 开 ) 的 
read 调 用 将 等 待 ， 直 到 有 数据 可 以 读 时 才 继 续 执 行 。 与 此 相反 ， 对 一 个 
空 的 、 非 阻塞 的 FIFO 的 read 调 用 将 立刻 返回 0 字 节 。 

对 一 个 完全 阻塞 FIFO 的 write 调用 将 等 待 ， 直 到 数据 可 以 被 写 入 时 
如 果 FIFO 不 能 接收 所 有 写 入 的 数据 包 ， 它 将 按 下 面 的 规则 

{To 

O “如 果 请 求 写 入 的 数据 的 长 度 小 于 等 于 PIPE_BUF 字 节 ， 调 用 失 

败 ， 数 据 不 能 写 入 。 

口 “ 如 果 请 求 写 入 的 数据 的 长 度 大 于 PIPE_BUF 字 节 ， 将 写 入 部 分 数 

据 ， 返 回 实 际 写 入 的 字 节 数 ， 返 回 值 也 可 能 是 0。 

FIFO 的 长 度 是 需要 考虑 的 一 个 很 重要 的 因素 。 系 统 对 任 一 时 刻 在 一 
个 FIFO 中 可 以 存在 的 数据 长 度 是 有 限制 的 。 它 由 #define PIPE_BUF 语 句 
定义 ， 通 常 可 以 在 头 文 件 limits.h 中 找到 它 。 在 Linux 和 许多 其 他 类 UNIX 
系统 中 ， 它 的 值 通常 是 4 096 字 节 ， 但 在 某 些 系统 中 它 可 能 会 小 到 512 字 
节 。 系 统 规定 : 在 一 个 以 O_ WRONLY 方 式 〈 即 阻塞 方式 ) 打开 的 FIFO 
中 ， 如 果 写 入 的 数据 长 度 小 于 等 于 PIPE_BUF， 那 么 或 者 写 入 全 部 字 
节 ， 或 者 一 个 字 节 都 不 写 入 。 

虽然 ， 对 只 有 一 个 FIFO 写 进程 和 一 个 FIFO 读 进程 的 简单 情况 来 
说 ， 这 个 限制 并 不 是 非常 重要 ， 但 只 使 用 一 个 FIFO 并 允许 多 个 不 同 的 程 
序 回 一 个 FIFO 读 进程 发 送 请 求 的 情况 是 很 常见 的 。 如 果 几 个 不 同 的 程序 
尝试 同时 间 FIFO 写 数据 ， 能 否 保 证 来 自 不 同 程 序 的 数据 块 不 相互 交错 就 
非常 关键 了 。 也 就 是 说 ， 每 个 写 操作 都 必须 是 “原子 化 "的 。 怎 样 才能 做 
到 这 一 点 呢 ? 

如 果 你 能 保证 所 有 的 写 请 求 是 发 往 一 个 阻塞 的 FIFO 的 ， 并 且 每 个 写 
请 求 的 数据 长 度 小 于 等 于 PIPE_BUF 字 节 ， 系 统 就 可 以 确保 数据 决 不 会 
交错 在 一 起 。 通 常 将 每 次 通过 FIFO 传 递 的 数据 长 度 限制 为 PIPE_BUF 字 
节 是 个 好 方法 ， 除 非 你 只 使 用 一 个 写 进 程 和 一 个 读 进 程 。 


实 验 使 用 FIFO 实 现 进程 间 通 信 

为 了 演示 不 相关 的 进程 是 如 何 使 用 命名 管道 进行 通信 和 的， 我 们 需要 
用 到 两 个 独立 的 程序 fifo3.c 和 fifo4.c。 

(1) 第 一 个 程序 是 生产 者 程序 。 它 在 需要 时 创建 管道 ， 然 后 尽 可 


能 快 地 向 管道 中 写 入 数据 。 
注意 ， 出 于 演示 的 目的 ， 我 们 并 不 关心 写 入 数据 的 内 容 ， 所 以 
我 们 并 未 对 缓冲 区 进行 初始 化 。 在 这 两 个 程序 代码 中 ， 与 fifo2.c 不 
一 样 的 地 方 都 加 上 了 阴影 ， 处 理 命令 行 参数 的 代码 被 删除 了 。 


finclude 1istd.} 
#include <stdlib.h> 
#ir ide <stdio.h> 
#include <string.h> 
#include <fentl.h> 


#include <limits.h> 
#include <sys/types.h> 
#include RC 


#define FIFO NAME °/tmp/my_fifo" 
#define BUFFER_SIZE PIPE_BUF 
#define TEN_MEG (1024 * 1024 * 10) 


nt main 


int papa-ta; 

ir n_mode O_WRONLY ; 

int aut es_sent = 0; 

char buf fer [BUFFER SIZE + 1); 


access(FIFO_NAME, F_OK = 

res = mkfifo(FIFO_NA 7 

if es ( { 
fpr de F Le 
exit (EXIT_PA RE 


printf("Process $d opening FIFO O_WRONLY\n", getpid()); 
pipe_fd = open(FIFO_NAME, open_mode) ; 
printf("Process %d result %d\n", getpid(), pipe_fd); 


if (pipe_fd != -1) { 
while(bytes_sent < TEN_MEG) { 
res = write(pipe_fd, buffer, BUFFER_SIZE) ; 
if (res == -1) { 
fprintf(stderr, "Write error on pipe\n"); 
exit (EXIT_FAILURE) ; 


} 
bytes_sent += res; 
} 
(void) close (pipe_fd) ; 
} 
else { 
exit (EXIT_FAILURE) ; 
} 


printf("Process td finished\n", getpid()); 
exit (EXIT_SUCCESS) ; 


Fee — AN Za ` A SAG 
(2) 第 二 个 程序 是 消费 者 程序 ， 它 的 代码 要 简单 得 多 ， 它 从 FIFO 

Xy siz, ay mR y 
RAGE CI]. 

#include <unistd.h> 

include <stdlib.h> 

include <stdio.h> 

include <string.h> 

include <fentl.h> 

include <limits.h> 

@include <sys/types.h> 

@include <sys/stat.h> 


@define FIFO NAME */tmp/my_fifo* 
#define BUFFER_SIZE PIPE_BUF 


ant main() 


int pipe_fd: 

int res; 

int open mode = O_RDONLY; 
char buffer(BUFPER_SIZE + 1}; 
int bytes_read = 0; 


memset (buffer, '\0', sizeof (buffer) ); 

printf ("Process td opening FIFO O_RDONLY\n", getpid()):; 
pipe_fd = open(FIFO_NAME, open_mode); 

printf ("Process %d result $d\n", getpid(), pipe fd): 


if (pipe_fd != -1) { 
{ 


printf (‘Process td finished, td bytes read\n", getpid(), bytes_read); 


我 们 在 运行 这 两 个 程序 的 同时 ， 用 time 命 令 对 读 进 程 进行 计时 。 输 
出 结果 如 下 所 示 〈 为 简洁 起 见 ， 对 结果 做 了 一 些 修改 ): 

$ ./£1£03 & 

[1] 375 

Process 375 opening FIFO O_WRONLY 

$ time ./fifo4 

Process 377 opening FIFO O_RDONLY 

Process 375 result 3 

Process 377 result 3 

Process 375 finished 

Process 377 finished, 10485760 bytes read 


real Om0.053s 


user Om0.020s 

sys Om0.040s 

[1]+ Done FELEO 
实验 解析 


两 个 程序 使 用 的 都 是 阻塞 模式 的 FIFO。 我 们 首先 启动 fifo3 (SH 
程 /生产 者 ) ， 它 将 阻 堵 以 等 竺 读 进程 打开 这 个 FIFO。fifo4〈 消 费 者 ) 
启动 以 后 ， 写 进程 解除 阻塞 并 开始 向 管道 写 数据 。 同 时 ， 读 进程 也 开始 
从 管道 中 读 取 数据 。 


Linux 会 安排 好 这 两 个 进程 之 间 的 调度 ， 使 它们 在 可 以 运行 的 
时 候 运 行 ， 在 不 能 运行 的 时 候 阻 塞 。 因 此 ， 写 进程 将 在 管道 满 时 阻 
寺 ， 读 进程 将 在 管道 空 时 阻塞 。 
time 命 令 的 输出 显示 ， 读 进程 只 运行 了 不 到 0.1 秒 的 时 间 ， 却 读 取 了 


10MB 的 数据 。 这 说 明 管 道 〈 至 少 在 现代 Linux 系 统 中 的 实现 ) 在 程序 之 
间 传 递 数 据 是 很 有 效率 的 。 


作为 学 习 FIFO 的 最 后 一 部 分 内 容 ， 我 们 来 考虑 怎样 通过 命名 管道 来 
编写 一 个 非常 简单 的 客户 /服务 器 应 用 程序 。 我 们 想 只 用 一 个 服务 器 进 
ee 和 
Te Bes 

我 们 想 允 许多 个 客户 进程 部 可 以 辣 服 务 嚣 发送 数据 。 为 了 使 问题 简 
单 化 ， 我 们 假设 被 处 理 的 数据 可 以 被 拆 分 为 一 个 个 数据 块 ， 每 个 的 长 度 
都 小 于 PIPE_BUF 字 节 。 当 然 ， 我 们 可 以 用 很 多 方法 来 实现 这 个 系统 ， 
但 在 这 里 我 们 只 考虑 一 种 方法 ， 即 可 以 体现 如 何 使 用 命名 管道 的 方法 。 

因为 服务 器 每 次 只 能 处 理 一 个 数据 块 ， 所 以 只 使 用 一 个 FIFO 应 该 是 
合乎 逻辑 的 ， 服 务 器 通过 它 读 取 数 据 ， 每 个 客户 回 它 写 数据 。 只 要 将 
FIFO 以 阻塞 模式 打开 ， 服 务 器 和 客户 就 会 根据 需要 自动 被 阻塞 。 

将 处 理 后 的 数据 返回 给 客户 稍微 有 些 困 难 。 我 们 需要 为 每 个 客户 安 
排 第 二 个 管道 来 接收 返回 的 数据 。 通 过 在 传递 给 服务 器 的 原先 数据 中 加 
上 客户 的 进程 标识 符 PID) ， 双 方丈 可 以 使 用 它 来 为 返回 数据 的 管 让 
ENTANET 


实 验 一 个 客户 /服务 顺应 用 程序 的 例子 
(1) 首先 ， 我 们 需要 一 个 头 文件 clienth， 它 定义 了 客户 和 服务 器 
程序 都 会 用 到 的 数据 。 为 了 方便 使 用 ， 它 还 包含 了 必要 的 系统 头 文件 。 


(2) 现在 是 服务 器 程序 server.c。 在 这 一 部 分 ， 我 们 创建 并 打开 服 
务 嚣 省 道 。 它 被 设置 为 只 读 的 阻 暑 模式 。 在 稍 作 休息 (这 是 出 于 演示 的 
目的 ) 之 后 ， 服 务 器 开始 读 取 客户 发 送 来 的 数据 ， 这 些 数据 采用 的 是 


data_to_pass_st 结 构 。 


fito td 


(3) 在 接 下 来 的 这 一 部 分 中 ， 我 们 对 刚 从 客户 那里 读 到 的 数据 进 
行 处 理 ， 把 some_data 中 的 所 有 字符 全 部 转换 为 大 写 ， 并 且 把 
CLIENT_FIFO_NAME 和 接收 到 的 client_pid 结 合 在 一 起 。 


(4) 然后 ， 我 们 以 只 写 的 阻 窗 模式 打开 客户 管道 ， 把 经 过 处 理 的 
数据 发 送 回去 。 了 最 后 ， 关 闭 服务 器 管道 的 文件 描述 符 ， 删 除 FIFO 文 件 ， 
退出 程序 。 


(5) 下 面 是 客户 程序 client.c。 这 个 程序 的 第 一 部 分 先 检 查 服务 器 
FIFO 文 件 是 否 存 在 ， 如 果 存 在 就 打开 它 。 然 后 它 获 取 自 己 的 进程 ID， 
该 进程 ID 构成 要 发 送 给 服务 器 的 数据 的 一 部 分 。 接 下 来 ， 它 创建 客户 
FIFO， 为 下 一 部 分 内 容 做 好 准备 。 


Sinc 


#inc 


int 


{ 


OM Be 


lude "client.h* 
lude <ctype.h> 


main () 
int server_fifo_fd, client_fifo_fd; 
struct data_to_pass_st my_data; 


int times_to_send; 
char client tifo[256]; 


server_fifo_fd = open(SERVER_FIFO_NAME, O_WRONLY); 
if (server_fifo_fd = 1) 1 

fprintf(stderr, “Sorry, no server\n"): 

exit (EXIT_FAILURE) ; 
) 


my_data.client_pid = getpid(); 


sprintf(client_fifo, CLIENT_FIFO_NAME, my_data.client_pid); 
if (mkfifoiclient_fifo, 0777) == -1) { 
fprintf(stderr, “Sorry, can't make ts\n*, client fifo); 
@xit (EXIT _FPAILURE} ; 
} 


(6) 这 部 分 有 5 次 循环 ， 在 每 次 循环 中 ， 客 户 将 数据 及 送 给 服务 
然后 打开 客户 FIFO《〈 只 读 ， 阻 塞 模式 ) 并 读 回 数据 。 在 程序 的 最 
关闭 服务 器 FIFO 并 将 客户 FIFO 从 文件 系统 中 删除 。 


for (times_to_send = 0; times_to_send < 5; times_to_send++} { 

sprintf (my_data.some data, “Hello from $d", my_data.client_pid);: 
printf(*td sent %s, *, my_data.client_pid, my_data.some_data); 
write(server_fifo_fd, amy_data, sizeof (my_data)); 
client_fifo_fd = open(client_fifo, O_RDONLY); 
if (client fifo ta t= -1) { 

if (read(client_fifo_fd, amy_data, sizeof (my_data)) > 0) { 

printf{(*received: %s\n", my_data.some_data) ; 
} 
close(client_fifo_fd); 


} 

close (server_fifo_fd); 
unlinkiclient_fifo) ; 
exit (EXIT_SUCCESS) ; 


MUIR AS AEE, RAI ths BEI IT PS RA a Be PAS PS PBF o 


为 了 


所 示 


让 多 个 客户 程序 尽 可 能 在 同一 时 间 局 动 ， 我 们 使 用 如 下 所 示 的 shell 


sent Hello from 531, received: HELLO FROM 531 
sent Hello from 532, received: HELLO FROM 532 
sent Hello from 529, received: HELLO FROM 529 
sent Hello from 530, received: HELLO FROM 530 
sent Hello from 531, received: HELLO FROM 531 
sent Hello from 532, received: HELLO FROM 532 
上 述 命令 启动 了 一 个 服务 器 进程 和 5 个 客户 进程 。 客 户 的 输出 如 下 
(为 了 简洁 起 见 ， 我 们 做 了 一 些 修 改 ) : 


eived: HELLO FROM 531 
ived: HELLO FROM 532 
red: HELLO FROM 529 

30 sent Hello from 530, received: HELLO FROM 530 
31 sent Hello from 531, received: HELLO FROM 531 
532 sent Hello from 532, r d: HELLO FROM 532 
的 客户 请 求 交 错 在 一 起 ， 但 每 个 客户 都 获得 了 正确 
的 服务 器 返回 给 它 的 处 理 数据 。 要 注意 的 是 客户 请 求 的 交错 顺序 是 随机 
的 ， 服 务 器 接收 到 客户 请 求 的 顺序 随机 器 的 不 同 而 不 同 ， 即 使 是 在 同一 
台 机 器 上 ， 每 次 运行 的 情况 也 可 能 发 生变 化 。 

实验 解析 

现在 ， 我 们 将 解释 客户 和 服务 器 在 交互 时 各 种 操作 的 执行 顺序 ， 这 
是 我 们 以 前 未 涉及 的 。 

服务 器 以 只 读 模式 创建 它 的 FIFO 并 阻塞 ， 直 到 第 一 个 客户 以 写 方式 
打开 同一 个 FIFO 来 建立 连接 为 止 。 此 时 ， 服 务 器 进程 解除 阻塞 并 执行 
Sleep 语句 ， 这 使 得 来 自 客户 的 数据 排队 等 候 。 在 实际 的 应 用 程序 中 ， 应 
该 把 sleep 语 句 删 除 。 我 们 在 这 里 使 用 它 只 是 为 了 演示 当 有 多 个 客户 的 请 
求 同 时 到 达 时 ， 程 序 的 正确 操作 方法 。 

与 此 同时 ， 在 客户 打开 了 服务 器 FIFO 后 ， 它 创建 自己 唯一 的 一 个 命 
名 管道 来 读 取 服务 器 返回 的 数据 。 完 成 这 些 工作 后 ， 客 户 发 送 数 据 给 服 
务 器 (如 果 管 道 满 或 服务 嚣 仍 在 休眠 中 就 阻塞 ) ， 然 后 阻塞 在 对 目 己 的 
FIFO 的 read 调 用 上 ， 等 待 服务 器 的 响应 。 

接收 到 来 自 客户 的 数据 后 ， 服 务 器 处 理 它 ， 然 后 以 写 方式 打开 客户 
管道 并 将 处 理 后 的 数据 返回 ， 这 将 解除 客户 的 阻塞 状态 。 客 户 被 解除 阻 
窟 后 ， 它 即 可 从 自己 的 省 道中 读 取 服务 器 返回 的 数据 。 

整个 处 理 过 程 不 断 重复 ， 直 到 最 后 一 个 客户 关闭 服务 器 管道 为 止 ， 
这 将 使 服务 器 的 read 调 用 失败 (返回 9， ， 因 为 已 经 没有 进程 以 写 方式 
打开 服务 器 管道 了 。 如 果 这 是 一 个 真正 的 服务 器 进程 ， 它 还 需要 继续 等 
待 客户 的 请 求 ， 我 们 就 需要 对 它 进行 修改 ， 有 两 种 方法 ， 如 下 所 示 。 

O 对 它 自 己 的 服务 喜 管 道 打开 一 个 文件 摘 述 符 ， 这 样 read 调 用 将 

总 是 阻塞 而 不 是 返回 0。 

口 “ 当 read 调 用 返回 0 时 ， 关 闭 并 重新 打开 服务 器 管道 ， 使 服务 器 进 

程 阻 旱 在 open 调 用 处 以 等 待 客户 的 到 来 ， 惑 像 它 最 初 启动 时 那样 。 
人 
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13.7 CD NY 用 程 户 


在 看 过 如 何 用 命名 管道 来 实现 一 个 简单 的 客户 /服务 器 系统 后 ， 我 
们 将 重新 阅读 CD 数据 库 应 用 程序 ， 并 据 此 对 它 进 行 改 进 。 我 们 还 将 添 
加 一 些 信号 处 理 内 容 ， 使 我 们 可 以 在 进程 被 中 断 时 执行 一 些 清理 工作 。 
为 了 使 代码 尽 可 能 简单 ， 我 们 将 使 用 早期 的 只 有 一 个 命令 行 接口 的 dbm 


版 本 。 

在 深入 研究 这 个 新 版 本 之 前 ， 先 来 编译 这 个 新 的 应 用 程序 。 如 果 你 
己 经 从 网 站 上 下 载 了 源 代 码 ， 就 可 以 用 makefile 将 它 编 译 为 server 和 client 
这 两 个 程序 。 


第 7 章 讲 过 ， 不 同 的 Linux 发 行 版 命名 和 安装 dbm 文 件 的 方式 略 
微 不 同 。 如 果 我 们 提供 的 文件 不 能 在 你 的 系统 中 成 功 编译 ， 请 回顾 
第 7 章 有 关 dbm 文 件 命名 和 位 置 的 内 容 。 


键入 命令 server-i， 将 使 程序 初始 化 一 个 新 的 CD 数据 库 。 
不 用 说 ， 如 果 服 务 器 未 局 动 运 行 ， 客 户 程 序 是 不 会 运行 的 。 下 面 是 
makefile 文 件 的 内 容 ， 它 显示 了 程序 是 如 何 组 织 在 一 起 的 : 


# the compatibility 
@ DBM_LIB_FILE=-igdbm er 
NC PAT A 
P appui cd a.h 
|_ dk cd_dbm cd_data.h 
client f.o: clier f.c _dat 
p pipe p- i dat 
rve cd ah 
app 
pipe. 
erver: V d dbm pip 
$ (cc -L$ (DBM FLAGS d db 
DEM_LIB 
ean 
rm app 


13.7.1 不 


我 们 的 目标 是 把 这 个 应 用 程序 中 处 理 数据 库 的 部 分 和 用 户 界面 部 分 
分 开 。 我 们 还 而 望 只 运行 一 个 服务 器 进程 ， 但 允许 存 在 许多 并 发 的 客户 
2 

为 了 简化 应 用 ， 我 们 还 希望 能 够 在 应 用 程序 中 创建 (和 删除 〉 管 
道 ， 这 样 就 无 需 让 系统 管理 员 在 运行 程序 之 前 为 我 们 创建 命名 管道 了 。 

还 有 一 点 非 党 重要， 就 是 我 们 决 不 能 “ 忙 等 待 ?车 个 事件 的 发 生 ， 从 
而 减少 CPU 时 间 的 浪 绩 。 正 如 我 们 看 到 的 ，Linux 允 许 我 们 阻 具 以 等 待 
事件 的 发 生 ， 从 而 避免 消耗 很 多 系统 资源 。 我 们 可 以 利用 管道 的 阻塞 特 
性 来 确保 对 CPU 的 有 效 使 用 。 总 之 ， 服 务 器 至 少 在 理论 上 可 以 在 客户 请 
求 到 来 之 前 等 待 许多 个 小 时 。 


13.7.2 ”实现 


在 第 7 草 这 个 应 用 程序 的 早期 单 进程 版 本 中 ， 我 们 用 一 组 数据 访问 
例 程 来 处 理 数 据 ， 它 们 是 : 


void đatabase_close(voið); 
cdc_entry get_cd 


ew_cdatabase); 


Qa re 


on 
cdt_entry get_cdt_entry(const char *cd catalog ptr, const int track no); 
int add_cdc_entry(const cdc_entry entry_to_add); 
a ect 
entry char 
ntry char st i 
_entry arch_cd ry ptr 


sall ptr} 


这 些 函 数 提供 了 一 个 方便 的 起 点 ， 让 我 们 可 以 把 客户 和 服务 器 两 部 


分 清楚 地 分 开 。 
这 个 应 用 程序 的 单 进程 实现 版 本 虽然 被 编译 为 一 个 单独 的 程序 ， 但 
我 们 可 以 把 它 看 作 是 由 两 部 分 组 成 的 ， 如 图 13-6 所 示 。 


数据 访问 例 程 


数据 库 访问 


图 13-6 


在 客户 /服务 器 实现 版 本 中 ， 我 们 想 在 这 个 应 用 程序 的 两 个 主要 部 
A E RS 图 13-7 显 示 了 我 们 需要 的 
在 具体 实现 中 ， 我 们 选择 把 客户 和 服务 器 的 接口 例 程 都 放 在 同一 个 
文件 pipe_imp.c 中 。 这 就 把 在 客户 /服务 器 实现 版 本 中 依赖 命名 管道 使 用 
的 所 有 代码 都 集中 到 一 个 文件 中 。 而 将 传递 数据 的 格式 和 打包 方式 与 实 
现 命名 管道 的 例 程 分 离开 。 新 版 本 中 所 包含 的 源 文 件 更 多 了 ， 但 它们 之 
间 的 区 分 也 更 符合 逻辑 了 。 这 个 应 用 程序 的 调用 结构 如 图 13-8 所 示 。 


客户 服务 器 


pipe_imp.c pipe_imp.c 


F DAS 
ee Siac 
da s z 


图 13-8 


文件 app_ui.c、client_if.c 和 pipe_imp.c 将 被 编译 和 链接 在 一 起 构成 客 
户 端 程序 。 而 文件 cd_dbm.c、server.c 和 pipe_imp.c 将 被 编译 和 链接 在 一 
起 构成 服务 器 程序 。 头 文件 cliserv.h 将 以 一 个 公共 定义 头 文件 的 形式 把 
这 两 者 联系 在 一 起 。 

文件 app_uic 和 cd_dbm.c 只 做 了 少许 改动 ， 主 要 是 为 了 把 它 分 离 为 
两 个 程序 。 由 于 这 个 应 用 程序 现在 已 变 得 很 大 了 ， 而 代码 中 的 绝 大 部 分 
和 以 前 的 版 本 相 比 并 无 改动 ， 所 以 我 们 在 这 里 只 显示 文件 dliserv.h、 
client_if.c 和 pipe_imp.c 中 的 代码 。 


”这 个 文件 的 茶 些 部 分 依赖 于 客户 /服务 器 的 具体 实现 ， 在 本 例 
中 束 是 命名 管道 。 在 第 14 章 的 结尾 ， 我 们 还 将 改 用 另 一 种 不 同 的 客 
户 /服务 器 模型 。 


头 文 件 cliserv.h 
我 们 首先 来 看 头 文件 cliserv.h。 这 个 文件 定义 了 客户 /服务 器 接口 。 
客户 和 服务 器 的 实现 中 都 要 用 到 它 。 


DD 首先 全 各 


7 


RIRI: 


P 
Ei 
yE 


Eee 道 的 定义 。 我 们 为 服务 器 设置 一 个 管道 ， 为 每 
个 客户 分 别 设 置 一 个 管道 。 因 为 可 能 会 有 多 个 客户 ， 所 以 客户 管道 的 名 
字 中 要 加 上 它 的 进程 [D， 来 确保 管道 名 字 的 唯一 性 


3) 我 们 将 命 令 实 现 为 枚 举 类 型 ， 而 不 是 #define 和 常量 。 

使 用 枚 举 类 型 是 个 好 方法 ， 它 允 许 编译 器 进行 更 多 的 类 型 检查 并 且 
有 利于 软件 调试 。 因 为 许多 调试 器 可 以 显示 枚 举 常 量 的 名 字 ， 但 对 由 
#define 指 令 定 义 的 名 字 束 不行 。 

第 一 个 typedef 给 出 了 发 送 给 服务 器 的 请 求 类 型 ， 第 二 个 给 出 了 服务 
器 返回 给 客户 的 啊 应 闫 型 。 


(4) 接 下 来 我 们 声明 了 一 个 结构 ， 用 来 在 两 个 进程 之 间 进 行 双 
REIH Eo 


为 我 们 无 需 在 同一 个 啊 应 中 同时 返回 cdc_entry 和 cdt_entry， 
所 以 也 可 以 用 联合 变量 的 形式 将 它们 结合 在 一 起 。 但 出 于 简化 问题 
的 考虑 ， 我 们 还 是 将 它们 分 离开 来 ， 这 也 使 得 代码 更 易于 维护 。 


cde_entry 
cdt_entry entry _data; 
) or text [ERR TEXT LEN + 


“(5) 最 后 是 执行 数据 传输 工作 的 管道 接口 函数 ， 它 的 具体 实现 在 


文件 pipe_imp.c 中 。 它 们 分 为 服务 器 端 函 数 和 客户 问 函 数 两 组 ， 分 别 列 
在 下 面 的 第 一 部 分 和 第 二 部 分 : 


int xzead_resp_frcon_serVver1message_db _t *rec_ptr) 
from_server (void 


我 们 将 下 面 的 讨论 分 为 两 部 分 ， 一 部 分 介绍 客户 接口 函数 ， 另 一 部 
分 介绍 在 文件 pipe_imp.c 中 的 服务 器 端 和 客户 端 函数 的 实现 细节 ， 我 们 
会 在 必要 时 给 出 源 代码 。 

13.7.3 BE O pk 

现在 我 们 来 看 文件 dient_if.c。 它 提供 了 “ 假 ” 版 本 的 数据 库 访问 例 
程 。 这 些 例 程 对 请 求 进行 编码 并 将 它 放 入 message_db_t 结 构 ， 然 后 使 用 
pipe_imp.c 中 的 例 程 将 请 求 传输 给 服务 器 。 这 样 可 以 尽量 减少 对 原来 的 
app_ui.c 文 件 的 改动 。 


1. 客 户 命 令 解 释 器 


(1) 这 个 文件 实现 了 在 头 文件 cd_datah 中 定义 的 9 个 数据 库 函 数 。 
它 的 作用 如 同 是 一 个 中 转 站 ， 先 把 请 求 传递 给 服务 占 ， 然 后 从 函数 返回 
服务 器 的 啊 应 。 它 的 开始 部 分 是 #include 语 句 和 第 量 的 定义 : 


@tdefine _POS 


include *cd_data.h* 


(2) 静态 变量 mypid 减 少 了 对 getpid 函 数 的 调用 次 数 。 为 了 消除 重 
复 代 码 ， 我 们 使 用 了 局 部 函数 read_one_response: 


(3) 函数 database_initialize 和 close 仍 被 使 用 ， 但 与 以 往 不 同 ， 它 们 


pay ee 首 接口 的 客户 端 ， 一 个 用 来 删除 当 客户 退出 时 多 余 的 
命名 入 lake 


(4) 用 一 个 给 定 的 CD 唱片 标题 调用 get_cdc_entry 例 程 ， 将 从 数据 库 中 
取出 对 应 的 标题 数据 项 。 我 们 将 请 求 编码 到 一 个 message_db_t 结 构 中 并 
把 它 传递 给 服务 器 ， 然 后 将 服务 器 的 啊 应 读 回 到 男 一 个 message_db_t 结 
构 中 。 I SUE Ee aK LID 的 数据 项 ， 它 将 被 存放 在 
ee t 结 构 的 cdc_entry 结 构 中 ， 我 们 把 该 结构 作为 函数 的 返回 


7 et_cde_entry(const char *cd_ catalog ptr 


A THER 数 read_one_response 的 源 代码 ， 我 们 用 它 来 避免 重复 


static int read_one_response(message db t *rec ptr} 


(6) Hfthget_xxx. del_xxx#lladd_xxxI? x0 Hy fl Fe get_cdc_entry ef} 
数 的 实现 方式 类 似 。 为 了 代码 的 完整 性 ， 我 们 也 把 它们 列 在 下 面 ， 首 先 
是 用 来 检索 CD 曲目 的 函数 get_cdt_entry: 


(7) 接 下 来 是 两 个 添加 数据 的 函数 ， 第 一 个 用 于 标题 数据 库 ， 第 
二 个 用 于 曲目 数据 库 : 


if (send_mess_to_server(mess_send)}) { 
if (read_one_response(imess_ret)) ( 
if (mess_ret.response == r_success) 【 
return(1); 
) else [ 
fprintf(stderr, “Ys", mess_ret.error_text); 
} 
} else ( 
fprintf(stderr, "Server failed to respond\n"); 
) 
} else { 
fprintf(stderr, “Server not accepting requests\n"}; 
} 


return(0}; 


add_cdt_entry(const cdt_entry entry_to_add) 


message_db_t mess_send; 
message_db_t mess_ret; 


mess_send.client_pid = mypid; 
mess_send.request = s_add_cdt_entry; 
mess_send.cdt_entry_data = entry_to_add; 


if (send_mess_to_server(mess_send)) { 
if (read_one_response(imess_ret)) { 
if (mess_ret.response == r_success) { 
return(1); 
} else { 
fprintf(stderr, "%s", mess_ret,error_text}; 
) 
} else { 
fprintf(stderr, "Server failed to respond\n")}; 
} 
} else { 
fprintf(stderr, “Server not accepting requests\n"); 
} 
return(0); 


(8) 最 后 是 两 个 用 于 删除 数据 的 函数 : 


int del_cdc_entry(const char *ed_catalog ptr) 


{ 


message_db_t mess_send; 
message_db_t mess_ret; 


mess_send.client_pid = mypid; 
mess_send.request = s_del_cdc_entry; 
strcopy(mess_send.cdc_entry_data.catalog, cå catalog ptr); 


if (send_mess_to_server(mess_send)) | 
if (read_one_response(&mess_ret)) { 


2. 搜 索 数 据 库 


根据 CD 唱片 关键 字 进 行 搜 索 的 函数 非常 复杂 。 调 用 者 希望 每 调用 
它 一 次 就 开始 一 次 搜索 。 在 第 7 章 中 ， 为 了 满足 这 种 需求 ， 在 第 一 次 调 
用 该 函数 时 将 *first_call_ptr 设 置 为 rue， 这 样 它 将 返回 第 一 个 匹配 记 
录 。 在 后 续 对 搜索 函数 的 调用 中 ， 我 们 将 *first_call_ptr 设 置 为 false， 这 
样 它 返回 的 是 后 续 的 匹配 记录 ， 每 次 调用 返回 一 个 。 

现在 ， 由 于 我 们 已 将 应 用 程序 划分 为 两 个 进程 ， 在 服务 器 中 就 不 能 
再 允许 每 次 搜索 只 处 理 一 个 数据 项 了 ， 因 为 在 前 一 次 搜索 正在 进行 时 ， 
可 能 会 有 另 一 个 客户 开始 请 求 服务 器 进行 另外 一 次 搜索 。 我 们 也 不 能 让 
服务 器 端 分 别 保存 每 个 客户 搜索 的 上 下 文 〈 即 搜索 已 到 达 的 位 置 ) ， 
为 用 户 可 能 会 在 搜索 进行 到 一 半 时 ， 由 于 找到 了 想 找 的 CD 唱片 或 因为 
客户 突然 中 断 而 停止 这 次 搜索 。 

我 们 可 以 改变 搜索 的 执行 方式 ， 也 可 以 像 我 们 在 这 里 选择 的 那样 把 
这 些 复杂 性 隐藏 在 接口 例 程 中 。 我 们 的 做 法 是 ， 让 服务 器 把 搜索 的 可 能 
匹配 结果 全 部 返回 并 保存 在 一 个 临时 文件 中 ， 直 到 客户 请 求 它 们 。 


(1) 这 个 函数 看 上 去 很 复杂 ， 但 实际 并 非 如 此 。 它 调用 了 3 个 管道 
函数 〈 我 们 将 在 下 一 节 中 介绍 它们 ) : send_mess_to_server、 
start_resp_from_server#llread_resp_from_server. 


(2) 第 一 次 调用 这 个 函数 进行 搜索 时 ，*first_call_ptr 被 设置 为 


true。 我 们 最 好 现在 就 将 它 设置 为 false， 以 免 后 面 忘记 修改 它 。 然 后 创 
建 临 时 文件 work_file 并 初始 化 客户 消息 结构 。 


(3) 接 下 来 是 三 重 条 件 判断 ， 它 将 调用 pipe_imp.c 文 件 中 的 函数 。 
如 采 消 息 被 成 功 发 送 给 服务 器 ， 客 户 承 开始 等 待 服务 器 的 啊 应 。 成 功 读 
取 了 服务 器 返回 的 啊 应 后 ， 就 将 搜索 的 匹配 结 末 保存 到 客户 的 临时 文件 
work_ file 中 ， 同 时 增加 匹配 计数 器 entries_matching 的 值 。 


(4) 接 下 来 的 测试 检查 搜索 是 否 找 到 匹配 数据 。 然 后 通过 fseek 调 
用 设置 work_file 的 下 一 个 数据 写 入 位 置 。 


O 如 果 这 不 是 本 次 搜索 操作 中 第 一 次 调用 搜索 函数 ， 代 码 将 检 
但是 人 否 还 有 其 他 匹配 。 最 后 ， 把 下 一 个 匹配 数据 项 读 到 ret_val 结 构 中 。 
此 前 的 检查 用 来 确保 还 有 匹配 项 存在 。 


13.7.4 ”服务 器 接口 server.c 


如 同 客户 端 有 个 用 于 app_ui.c 程 序 的 接口 ， 服 务 器 端 也 需要 一 个 程 
序 用 来 控制 cd_dbm.c《〈 在 以 前 的 版 本 中 名 字 是 cd_access.c) 。 下 面 是 服 
务 器 的 main 函 数 代 码 。 
(1) 首先 声明 一 些 全 局 变量 、process_command 函 数 的 原型 和 一 个 
用 来 完成 退出 清理 工作 的 catch_signals 函 数 。 


(2) 下 面 是 main 函 数 的 代码 。 在 检查 完 信 号 捕获 例 程 可 以 正常 工 
作 后 ， 程 序 检查 用 户 是 否 在 命令 行 上 输入 了 -i 选 项。 如 果 有 ， 它 就 创建 
一 个 新 数据 库 。 如 果 调 用 cd_dbm.c 中 的 database_initialize 函 数 失 败 ， 束 
给 出 一 条 错误 消息 。 如 果 一 切 正常 则 服务 器 开始 运行 ， 来 自 客户 的 任何 
请 求 都 将 被 发 往 process_command 函 数 ， 我 们 后 面 将 会 讲 到 这 个 函数 。 


int main(int argc, char *argv[)) { 
struct sigaction new_action, old_action; 
message_db_t mess_command: 
int database_init_type = 0; 


new_action.sa_handler = catch_signals; 

sigemptyset (&new_action.sa_mask); 

new_action.sa_flags = 0; 

if ((sigaction(SIGINT, Enew_action, &old_action) != 0) || 
(sigaction(SIGHUP, &mew_action, kold action) != 0) || 
(sigaction(SIGTERM, &new_ection, kold action} != 0)) { 
fprintfistderr, "Server startup error, signal catching failed\n"); 
exit (EXIT_FAILURE) ; 


if {argc > 1) 1 
argv++: 
if (strnemp("-i", ‘argv, 2) == 0) database_init_type = 1; 
} 
if (ldatabase_initialize(database_init_ type)) { 
fprintf(stderr, ‘Server error:=\ 
could not initialize database\n"); 
exit (EXIT_PAILURE) ; 
} 


if (!server_starting({)) exit (EXIT_FAILURE): 


whileiserver_running) { 
if (read_request_from_client (amess_command)) { 
process_command(mess_command) ; 
} else { 
if(server_running) fprintf(stderr, "Server ended - can not \ 
read pipe\n"):; 
server_running = 0; 
) 
) /* while */ 
server_ending()}; 
exit (EXIT _SUCCESS) ; 


(3) 所 有 客户 的 消息 都 将 被 发 往 process_command 函 数 ， 在 那里 它 
们 被 放 入 一 个 case 语 句 ， 进 而 调用 cd_dbm.c 中 相应 的 函数 。 


static void process_command(const message_db_t comm) 


{ 


message_db_t resp; 
int first_tine = 1; 


resp = comm; /* copy command back, then change resp as required */ 


if (fetart_reep_to_client(resp)) ( 
fprintf(stderr, "Server Warning:~-\ 
start_resp_to_client td failed\n*, resp.client_pid); 
return; 


resp.responge = r_success; 
memset (resp.error_text, ‘\0', sizeof(resp.error_text)); 
save errno © 0; 


switchiresp. request) { 

case s_Create_new_ database: 
if (!database_initialize{1)) resp. response = r failure; 
break; 

case s_get_cde_entry: 
resp.cdc_entry_data = 

get_cic_entry (comm. cdc_entry_data.catalog); 

break; 

case s_get_cdt_entry: 


resp.cdt_entry_data = 
get_cdt_entry (comm. cdt_entry_data.catalog, 
comm. cdt_entry_data.track no}; 
break; 
case s_add_cdc_entry: 
if (!add_cdc_entry(comm.cdc_entry_data)} resp.response = 
r_failure; 
break; 
case s_add_cdt_entry: 
if (!add_edt_entry(comm.cdt_entry_data)) resp.response = 
r_failure; 
break; 
case s_del_cdc_entry: 


if (!del_cde_entry(comm.cde_entry_data.catalog)) reep.response 


* r_failure; 
break: 
case s_del_cdt_entry: 
if (!del_cdt_entry(ccam.cdt_entry_data.catalog, 


comm. cdt_entry_data.track_no)) resp.response = r_failure; 


break; 
case #_find_cde_entry: 
do { 
resp.cde_entry_data = 
search_cdc_entry (comm. cdc_entry_data.catalog, 
&firet_time); 
if (resp.cdc_entry_data.catalog[0] != 0) { 
resp.response = r_success; 


在 介绍 管道 的 具体 实现 之 前 ， 我 们 移 来 看 看 ， 在 客户 和 服务 器 进程 
之 间 传 递 数 据 时 各 种 事件 发 生 的 移 后 顺序 。 图 13-9 显 示 客 户 和 服务 器 进 
程 在 各 自 局 动 之 后 ， 双 方 在 处 理 命令 和 响应 时 的 循环 情况 。 

在 具体 实现 中 ， 情 况 要 更 复杂 一 些 。 因 为 在 搜索 请 求 中 ， 客 户 向 服 
务 露 传递 一 条 命令 ， 然 后 等 竺 从 服务 器 中 接收 一 个 或 多 个 啊 应 。 这 就 使 
得 情况 更 复杂 了 ， 但 主要 是 在 客户 端 。 


客户 显 
示 结 果 


图 13-9 


13.7.5 ”管道 


下 面 是 实现 管道 功能 的 pipe_imp.c 文 件 ， 它 同时 包含 客户 端 和 服务 
器 端的 函数 。 
”在 第 10 章 中 我 们 见 到 过 DEBUG_TRACE 标 志 ， 我 们 可 以 通过 定义 
Ny ee ee ea 
KF. 


1. 管 道 实 现 的 开始 部 分 


(1) 首先 是 #include 语 人 句 : 


#include "cd data.h" 
#include "cliserv.h" 


(2) 我 们 还 定义 了 一 些 在 此 文件 里 的 函数 中 会 用 到 的 值 : 


myp2c = 


2. 服 务 器 端 函数 


接 下 来 ， 我 们 来 看 服务 器 端的 水 数 。 第 一 部 分 显示 打开 、 关 闭 命名 
管道 和 读 取 来 自 客户 的 消息 的 函数 。 第 二 部 分 显示 用 于 打开 、 发 送 和 关 
闭 客户 管道 的 代码 ， 客 户 管 道 名 基于 客户 包含 在 其 请 求 消 明 中 的 进程 ID 
来 确定 。 

。 服 务 器 函数 

(1) ”server_starting 例 程 先 为 服务 器 创建 一 个 它 将 从 中 读 取 命令 的 
命名 管道 ， 然 后 以 只 读 方式 打开 这 个 管道 。 这 个 open 调 用 将 阻塞 到 有 客 
户 以 写 方式 打开 这 个 管道 为 止 。 使 用 阻塞 模式 可 以 使 服务 器 在 等 待 发 送 
过 来 的 命令 时 对 管道 执行 阻塞 式 读 取 。 


)\\n", getpid()); 


(2) 当 服 务 需 结束 时 ， 它 删除 命名 管道 ， 这 样 客户 就 可 以 检 训 出 
没有 服务 需 在 运行 : 


tendif 


(3) 下 面 给 出 的 read_request_from_client 函 数 会 阻塞 在 对 服务 器 管 
道 的 读 操作 上 ， 直 到 有 客户 向 其 中 写 入 一 条 消息 为 止 : 


rep 


int read_bytes; 


#if DEBUG_TRACE 


printf("td :- read_request_from_client()\n", getpid()); 
#endif 
if (server_fd != -1) { 


read_bytes = read(server_fd, rec_ptr, sizeof(*rec_ptr)); 


} 


return(return_code) ; 


} 


(4) 如 果 出 现 没 有 任何 客户 以 写 方式 打开 这 个 管道 的 特殊 情况 ， 
read 调 用 将 返回 0。 也 就 是 说 ， 它 检测 到 一 个 EOFE， 此 时 服务 器 会 关闭 管 
道 并 重新 打开 它 ， 这 样 服务 器 就 可 以 阻塞 到 有 客户 打开 这 个 管道 为 止 。 
这 与 服务 器 第 一 次 启动 时 的 情况 完全 一 样 ， 等 于 我 们 重新 初始 化 了 服务 
器 。 把 下 面 这 些 代码 插 到 上 面 的 函数 中 去 : 


void) close (server_fd); 
: 3 nan iSERURER DTDE O RANAN Y 
ric open (SERVER PIPE, O_RDONL 
PINTR) f 


服务 器 是 一 个 进程 ， 它 可 能 同时 为 许多 客户 服务 。 因 为 每 个 客户 用 
不 同 的 管道 接收 啊 应 ， 所 以 服务 器 需要 使 用 不 同 的 管道 来 给 不 同 的 客户 
发 送 啊 应 。 而 由 于 文件 描述 符 是 一 种 有 限 资 源 ， 所 以 服务 器 只 有 在 需要 
发 送 数据 时 才 会 以 写 方 式 打开 一 个 客户 管道 。 

我 们 将 打开 、 写 入 和 关闭 客户 管道 分 离 为 3 个 独立 的 函数 。 这 是 为 
了 适应 数据 库 搜索 返回 多 个 搜索 结果 的 情况 ， 这 样 我 们 可 以 只 打开 管道 
一 次 ， 写 入 多 个 啊 应 ， 然 后 再 关闭 它 。 

“探测 管道 


D 首先 打开 客户 管道 


printf£(*td :- start_resp_to_client{)\n", getpid()}; 


lient_fd = open(client.pipe_name, O_WRONLY) 


returr 


(2) 消 轧 都 是 通过 调用 这 个 函数 发 送出 去 的 。 我 们 后 面 就 会 看 到 
对 应 的 用 于 接收 消 妃 的 客户 端 函 数 。 


IEBUS TRACE 


(3) 最 后 ， 关 闭 客户 管道 ; 


$if DEBUG_TRACE 


3. 客 户 端 函数 


pipe_imp.c 文 件 中 与 服务 器 端 函 数 互 补 的 是 客户 端 函 数 ， 除 了 那个 
名 为 send_mess_to_server 的 函数 ， 它 们 都 与 服务 器 端 函数 很 相似 。 
02 F PRI BL 
(1) 在 检查 到 服务 器 可 访问 后 ，client_starting 函 数 初 始 化 客户 端 


me 


道 


‘$ E TRACE 
D ("4d := client @ rting 

fendi 

myy ge 

if server. > E PE, 1) 
eturn 


voit 4 ient_endin d 
#if DESUG TRA 
print d 1 
fendit 
if (clie it 3 l w 
i (client_fd != i ient fd 
if (server_fd != -1) (void})closelserver_f£d) 


(void) unlink: Bites ipe_name) ; 
(3) send_mess_to_server 疯 数 的 作用 是 通过 服务 器 管道 传递 请 求 : 
nt send mess to server (message_ db t mess_to_send 


int write_bytes; 


if DEBUG_TRACE 


£( "8c 


a 
3 
+ 


GBT BI TELA BUA ARS aise PBB DV, A T EEREN RA 
果 ， 客 户 在 从 服务 器 取 回 结果 时 也 使 用 了 3 个 函数 。 

“取得 服务 器 返回 的 结果 

C1) 这 个 客户 函数 开始 监 昕 服务 器 的 啊 应 。 它 先 以 只 读 方式 打开 
一 个 客户 管道 ， 然 后 又 以 只 写 方式 重新 打开 这 个 管道 。 我 们 将 在 本 布 的 
稍 后 部 分 解释 这 样 做 的 原因 。 


(2) 下面 是 具体 负 贡 从 服务 器 读 取 啊 应 的 read 调 用 ， 它 将 取 回 匹 
配 的 数据 库 条 目 : 


(3) 最 后 这 个 客户 函数 标记 服务 器 啊 应 的 结束 : 


expty 


在 start_resp_from_server 疯 数 中 第 二 个 以 写 方式 打开 客户 省 这 的 调 
用 是 : 


lien rite fd = onen(client nine name O WRONTY): 
client_write_fd = open(client_pipe_name, O_WRONLY) 


TER IE 56 FR PEL, SEAR TP SS CER AE is BS MF OR 
自 同 一 个 客户 的 快速 、 连 续 的 多 个 请 求 时 发 生 。 

为 了 将 这 个 问题 解释 得 更 清楚 ， 我 们 来 看 看 这 个 事件 发 生 的 过 程 。 

D 客户 发 送 一 个 请 求 给 服务 句 。 

(2) 服务 器 读 取 请 求 ， 打 开 客 户 管 让 并 发 回 啊 应 ， 但 在 关闭 客户 
管道 之 前 被 挂 起 。 


: (3) 客户 以 读 方式 打开 自己 的 管道 ， 读 取 第 一 个 啊 应 并 关闭 管 
道 。 

(4) 客户 然后 发 送 一 个 新 命令 并 再 次 以 读 方 式 打 开 客 户 管 道 。 

(5) 此 时 服务 需 恢 复 运行 ， 关 闭 它 那 端的 客户 管道 。 

糟糕 的 是 ， 此 时 客户 正 答 试 从 这 个 管道 读 取 数据 ， 等 竺 目 己 下 一 个 
请 求 的 啊 应 ， 但 因为 已 无 进程 以 写 方式 打开 这 个 客户 管道 ， 所 以 read 调 
用 将 返回 0 字 节 。 

通过 允许 客户 以 读 写 两 种 方式 打开 它 自 己 的 管道 ， 就 消除 了 反复 重 
新 打开 这 个 管道 的 需要 ， 从 而 避免 了 竞争 条 件 的 产生 。 因 为 客户 永远 也 
不 会 问 这 个 管道 写 数 据 ， 所 以 不 会 有 读 到 错误 数据 的 危险 。 


13.7.6 ”对 CD 类 立 用 程序 的 总 结 


现在 ， 我 们 已 经 把 CD 数据 库 应 用 程序 分 为 客户 和 服务 器 两 部 分 
了 ， 这 使 我 们 可 以 对 用 户 界面 和 底层 的 数据 库 技术 分 别 进行 独立 的 开 
发 。 我 们 可 以 看 到 ， 一 个 精心 定义 的 数据 库 接口 可 以 让 应 用 程序 的 每 个 
主要 部 分 充分 地 使 用 计算 机 资源 。 进 一 步 地 ， 我 们 还 可 以 把 管道 实现 广 
案 改 进 为 网 络 实现 方案 ， 并 使 用 一 个 专用 的 数据 库 服务 器 。 我 们 将 在 第 
15 章 学 习 更 多 的 网 络 编程 。 


13.8 ”人 小结 


在 本 章 中 ， 我 们 介绍 了 如 何 使 用 管道 在 进程 之 间 传 递 数据 。 首 先 ， 
介绍 了 通过 popen 或 pipe 调 用 创建 的 未 命名 管道 ， 并 且 讨 论 了 如 何 使 用 管 
道 和 dup 调 用 把 数据 从 一 个 程序 传递 到 另 一 个 程序 的 标准 输入 。 接 下 
来 ， 我 们 介绍 了 命名 管道 以 及 如 何在 不 相关 的 程序 之 间 传 递 数据 。 最 
后 ， 实 现 了 一 个 简单 的 客户 /服务 器 例子 ，FIFO 的 使 用 不 仅 同 我 们 提供 
了 进程 间 的 同步 ， 还 提供 了 双 同 的 数据 流 。 


也 这 里 所 指 的 情况 是 当 FIFO 被 设置 为 非 阻 紧 模 式 时 。 一 一 译 者 注 


在 本 章 中 ， 我 们 将 讨论 一 组 进程 间 通 信 的 机 制 ， 它 们 最 初 由 
AT&T System V.2 版 本 的 UNIX 引 入 。 由 于 这 些 机 制 都 出 现在 同一 个 版 本 
中 并 且 有 着 相似 的 编程 接口 ， 所 以 它们 又 和 常 被 称 为 IPC (Inter-Process 
Communication， 进 程 间 通信 ) 机 制 ， 或 被 更 常见 的 称 为 System V IPC. 
正如 我 们 所 看 到 的 ， 它 们 并 不 是 进程 间 通 信 的 唯一 方法 ， 但 人 们 通常 把 
这 些 特 定 的 机 制 称 为 System V IPC. 

在 本 章 中 ， 我 们 将 介绍 以 下 几 方 面 的 内 容 。 

口 信号 量 : 用 于 管理 对 资源 的 访问 。 

口 共享 内 存 : 用 于 在 程序 之 间 高 效 地 共享 数据 。 

Oo 消息 队列 : 在 程序 之 间 传 递 数据 的 一 种 简单 方法 。 


141 _ 信和 与 量 


当 我 们 编写 的 程序 使 用 了 线程 时 ， 不 管 它 是 运行 在 多 用 户 系统 上 、 
多 进程 系统 上 ， 还 是 运行 在 多 用 户 多 进程 系统 上 ， 我 们 通常 会 发 现 ， 程 
序 中 存在 着 一 部 分 临界 代码 ， 我 们 需要 确保 只 有 一 个 进程 (或 一 个 执行 
线程 ) 可 以 进入 这 个 临界 代码 并 拥有 对 资源 独占 式 的 访问 权 。 

信号 量 有 着 复杂 的 编程 接口 ， 但 幸运 的 是 ， 我 们 可 以 很 轻松 地 为 目 
己 提供 一 个 更 简单 的 接口 ， 它 足够 应 付 大 多 数 信号 量 编程 的 问题 。 

第 7 章 的 第 一 个 示例 程序 用 dbm 来 访问 数据 库 。 如 果 有 多 个 程序 试 
图 在 同一 时 间 更 新 这 个 数据 库 ， 数 据 就 可 能 会 遭 到 破坏 。 两 个 不 同 的 程 
序 要 求 不 同 的 用 户 同 数据 库 输 入 数据 ， 这 本 号 并 没有 错 ， 问 题 只 可 能 
现在 对 数据 库 进 行 更 新 的 那 部 分 代码 上 。 这 部 分 真正 执行 数据 更 新 的 代 
码 需要 独占 式 地 执行 ， 和 它们 被 称 为 临界 区 域 。 它 们 通常 只 在 一 个 大 型 程 
序 中 占据 一 小 段 的 代码 。 

为 了 防止 出 现 因 多 个 程序 同时 访问 一 个 共 圣 资源 而 引发 的 问题 ， 我 
们 需要 有 一 种 方法 ， 它 可 以 通过 生成 并 使 用 令 牌 来 授权 ， 在 任 一 时 刻 只 
能 有 一 个 执行 线程 访问 代码 的 临界 区 域 。 在 第 12 章 我 们 简单 介绍 了 一 些 
线程 特定 的 方法 ， 我 们 可 以 在 使 用 线程 的 程序 中 通过 互 斥 量 或 信号 量 来 
控制 对 临界 区 域 的 访问 。 在 本 章 中 ， 我 们 又 回 到 信号 量 的 主题 上 ， 但 将 
对 它们 如 何在 不 同 的 进程 之 间 使 用 做 更 具 普 过 意义 地 介绍 。 


我 们 在 本 章 介 绍 的 信号 量 函 数 比 在 第 12 章 看 到 的 用 于 线程 的 信 
号 量 函 数 要 更 通用 ， 所 以 请 不 要 把 这 两 者 混 消 。 


要 想 编 写 通用 的 代码 ， 以 确保 程序 对 有 茶 个 特定 的 资源 具有 独占 式 的 
访问 权 是 非常 困难 的 。 虽 然 有 一 个 名 为 Dekker 算 法 的 解决 方法 ， 但 这 个 
算法 依赖 于 “ 忙 等 竺 ?或 < 目 旋 锁 ?”。 也 就 是 说 ， 一 个 进程 要 持续 不 断 地 运 
行 以 等 每 茶 个 内 存 位 置 被 改变 。 在 像 Linux 这 样 的 多 任务 环境 中 ， 和 人们 
并 不 愿意 使 用 这 种 浪费 CPU 资 源 的 处 理 方法 。 但 如 果 硬 件 支 持 独 占 式 访 
问 〈 一 般 是 通过 特定 的 CPU 指令 的 形式 ) ， 那 么 情况 就 变 得 简单 多 了 。 
一 个 硬件 支持 的 例子 就 是 ， 用 一 条 指令 以 原子 方式 访问 并 增加 寄存 器 的 
值 ， 在 这 个 读 取 / 增 加 / 写 入 操作 执行 的 过 程 中 不 会 有 其 他 指令 〈 甚 至 一 
个 中 断 ) 发 生 。 

我 们 前 面 抑 过 的 一 种 可 能 的 解决 方法 是 ， 使 用 带 O_EXCL 标 志 的 
open 函 数 来 创建 锁 文 件 ， 它 提供 了 原子 化 的 文件 创建 方法 。 它 允许 一 个 
进程 通过 获取 一 个 令 牌 “ 即 新 创建 的 文件 ) 来 取得 成 功 。 这 个 方法 比较 


J 但 对 于 更 复杂 的 例子 ， 它 就 显得 比较 杂乱 且 缺 
SNK, 

荷兰 计算 机 科学 家 Edsger ”Dijkstra 提 出 的 信号 量 概念 是 在 并 发 编程 
领域 迈 出 的 重要 一 步 。 正 如 我 们 在 第 12 章 所 讨论 的 ， 信 号 量 是 一 个 特殊 
的 变量 ， 它 只 取 正 整数 值 ， 并 且 程 序 对 其 访问 都 是 原子 操作 。 在 本 章 
中 ， 我 们 将 对 这 个 较 早 的 简化 定义 做 进一步 的 解释 。 我 们 将 详细 说 明 信 
号 量 是 如 何 工 作 的 ， 如 何在 不 同 进程 之 间 使 用 具备 更 通用 功能 的 函数 ， 
而 不 是 像 我 们 在 第 12 章 中 看 到 的 那个 多 线程 程序 的 特例 。 

信号 量 的 一 个 更 正式 的 定义 是 : 它 是 一 个 特殊 变量 ， 只 人 允许 对 它 进 
了 等 待 (wait) 和 发 送信 号 〈signal) 这 两 种 操作 。 因 为 在 Linux 编 程 
F, “等 竺 ?和 “发 送信 号 ?都 已 具有 特殊 的 含义 ， 所 以 我 们 将 用 原先 定义 
9 符号 来 表示 这 两 种 操作 。 

o P《〈 信 和 号 量变 量 ) : 用 于 等 待 。 

口 V 信号 量变 量 ) : 用 于 发 送信 和 号。 

这 两 个 字母 分 别 来 自 于 荷兰 语 单词 passeren 〈 传 递 ， 就 好 像 位 于 进 
入 临界 区 域 之 前 的 检查 点 ) 和 vrijgeven ATRE, WAEA A 
界 区 域 的 控制 权 ) 。 在 与 信号 量 关 联 的 内 容 中 ， 你 可 能 还 会 看 到 术 
ier” Cup) AIS” (down) ， 它 们 取 目 开 、 关 信号 标志 的 用 法 。 


14.1.1 信号 量 的 定 》 


最 简单 的 信号 量 是 只 能 取 值 0 和 1 的 变量 ， 即 二 进 制 信号 量 。 这 也 是 
量 最 ? 


~ 


pmm 


fas ee IU AER. AREA ERRUR E S EER HA 
写 量 。 在 本 章 后 面 的 内 容 中 ， 我 们 将 集中 讨论 二 进 制 信号 量 。 


PV 操作 的 定义 非常 简单 。 假 设 有 一 个 信号 量变 量 SV， 则 这 两 个 操 

作 的 定义 如 表 14-1 所 示 。 
% 14-1 

还 可 以 这 样 看 信号 量 : 当 临 界 区 域 可 用 时 ， 信 号 量变 量 SV 的 值 是 
true， 然 后 P (sv) 操作 将 它 减 1 使 它 变 为 false 以 表示 临界 区 域 正 在 被 使 
H: 当 进 程 离开 临界 区 域 时 ， 使 用 V (sv) 操作 将 它 加 1， 使 临界 区 域 再 
次 变 为 可 用 。 注 意 ， 只 用 一 个 普通 变量 进行 类 似 的 加 减法 是 不 行 的 ， 
为 在 C、C++、C# 或 几乎 任何 一 个 传统 的 编程 语言 中 ， 都 没有 一 个 原子 
操作 可 以 满足 检测 变量 是 否 为 tue， 如 果 是 再 将 该 变量 设置 为 false 的 需 
要 。 这 也 是 信号 量 操作 如 此 特殊 的 原因 。 


14.1.2 一 个 理论 性 的 僧 


我 们 用 一 个 简单 的 理论 性 的 例子 来 说 明 其 工作 原理 。 假 设 有 两 个 进 
程 proc1 和 proc2， 这 两 个 进程 都 需要 在 其 执行 过 程 中 的 茶 一 时 刻 对 一 个 
数据 库 进行 独占 式 的 访问 。 我 们 定义 一 个 二 进 制 信和 与 量 sv， 该 变量 的 初 
始 值 为 1， 两 个 进程 都 可 以 访问 它 。 要 想 对 代码 中 的 临界 区 域 进行 访 
问 ， 这 两 个 进程 都 需要 执行 相同 的 处 理 步 骤 ， 事 实 上 ， 这 两 个 进程 可 以 
只 是 同一 个 程序 的 两 个 不 同 执行 实例 。 

两 个 进程 共享 信号 量变 量 sv。 一 旦 其 中 一 个 进程 执行 了 P (sv) 操 
作 ， 筷 将 得 到 信和 号 量 ， 并 可 以 进入 临界 区 域 。 而 第 二 个 进程 将 被 阻止 进 
入 临界 区 域 ， 因 为 当 它 试图 执行 P Cv) 操作 时 ， 它 会 被 挂 起 以 等 待 第 
一 个 进程 离开 临界 区 域 并 执行 V (sv) 操作 释放 信号 量 。 

需要 的 伪 代 人 码 对 两 个 进程 都 是 相同 的 ， 如 下 所 示 : 


semapnore sv = l; 


loop forever { 
P (Sv) ; 
critical code section; 
Visv); 
noncritical code section; 
} 
这 段 代 码 相 当 简 单 ， 这 是 因为 PV 操 作 的 功能 非常 强大 。 图 14-1 显 示 
了 PV 操作 是 如 何 把 守 代 码 中 的 临界 区 域 的 。 


进程 A 的 执行 线程 
! 信号 量 的 P 操 作 


进程 B 的 执行 线程 


进程 A 的 非 进程 B 的 非 
临界 区 域 部 分 临界 区 域 部 分 
任 一 时 刻 只 
eas 允许 一 个 执 
行 线程 进入 


言 号 量 的 V 操 作 临界 区 域 


图 14-1 


14.1.3 Linuxh (5-5 = 4Liil 


现在 ， 我 们 已 了 解 了 信号 量 的 含义 及 其 工作 原理 ， 接 下 来 我 们 来 看 
看 ， 在 Linux 系 统 中 是 如 何 实 现 这 些 功能 的 。Linux 系 统 中 的 信号 量 接口 
经 过 了 精心 设计 ， 它 提供 了 比 通常 所 需 更 多 的 机 制 。 所 有 的 Linux 信 号 
量 函 数 都 是 针对 成 组 的 通用 信号 量 进行 操作 ， 而 不 是 只 针对 一 个 二 进 制 
言 写 量 。 和 个 看 起 来 ， 这 好 像 把 事情 弄 得 更 复杂 了 ， 但 在 一 个 进程 需要 锁 
定 多 个 资源 的 复杂 情况 中 ， 这 种 能 够 对 一 组 信号 量 进行 操作 的 能 力 是 一 
个 巨大 的 优势 。 在 本 章 中 ， 我 们 将 集中 讨论 单个 信号 量 的 使 用 ， 因 为 在 
绝 大 多 数 情 况 下 ， 使 用 它 就 足够 了 。 

信号 量 函 数 的 定义 如 下 所 示 : 


#include <sys/sem.h> 


int semctl(int sem_id, int sem_num, int command, ...); 
int semget (key_t key, int num_sems, int sem flags); 
int semop(int sem_id, struct sembuf *sem_ops, size_t num_sem_ops); 


头 文件 sys/sem.h 通 常 依赖 于 另 两 个 头 文件 sys/types.h 和 
sys/ipc.h。 一 般 情 况 下 ， 它 们 都 会 被 sys/sem.h 上 自动 包含 ， 因 此 不 需 
要 为 它们 明确 添加 相应 的 贡 nclude 语 句 。 

在 逐个 介绍 这 些 函数 时 ， 请 记 住 ， 这 些 函 数 都 是 用 来 对 成 组 的 

言 号 量 值 进行 操作 的 。 这 使 得 ， 对 它们 的 操作 要 比 单个 信号 量 所 需 
要 的 操作 复杂 得 多 。 


参数 key 的 作用 很 像 一 个 文件 名 ， 它 代表 程序 可 能 要 使 用 的 某 个 资 
源 ， 如 果 多 个 程序 使 用 相同 的 key 值 ， 它 将 负责 协调 工作 。 与 此 类 似 ， 
由 semget 函 数 返 回 的 并 用 在 其 他 共享 内 存 函 数 中 的 标识 符 也 与 fopen 返 回 
的 FILE* 文 件 流 很 相似 ， 进 程 需要 通过 它 来 访问 共享 文件 。 此 外 ， 类 似 
于 文件 的 使 用 情况 ， 不 同 的 进程 可 以 用 不 同 的 信号 量 标识 符 来 指 问 同一 
个 信号 量 。 对 于 我 们 将 在 本 章 讨 论 的 所 有 IPC 机 制 来 说 ， 这 种 一 个 键 加 
上 一 个 标识 符 的 用 法 是 很 常见 的 ， 尺 管 每 个 机 制 都 使 用 独立 的 键 和 标识 
Pe 

1. semgetré žr 
站 semget 函 数 的 作用 是 创建 一 个 新 信号 量 或 取得 一 个 已 有 信和 号 量 的 


int semaet (kev t kev. int num sems, int sem [1aqs); 

第 一 个 参数 key 是 整数 值 ， 不 相关 的 进程 可 以 通过 它 访 问 同一 个 信 
号 量 。 程 序 对 所 有 信和 号 量 的 访问 都 是 间接 的 ， 它 先 提 供 一 个 键 ， 再 由 系 
统 生成 一 个 相应 的 信号 量 标识 符 。 只 有 semget 函 数 才 直 接 使 用 信和 号 量 


健 ， 所 有 其 他 的 信号 量 孙 数 部 是 使 用 由 semget 函 数 返回 的 信号 量 标识 


符 。 

有 一 个 特殊 的 信号 量 键 值 IPC_PRIVATE， 它 的 作用 是 创建 一 个 只 
有 创建 者 进程 才 可 以 访问 的 信号 量 ， 但 这 个 键 值 很 少 有 实际 的 用 途 。 在 
创建 新 的 信号 量 时 ， 你 需要 给 键 提 供 一 个 唯一 的 非 零 整数 。 

num_sems 人 参数 指定 需要 的 信号 量 数目 。 它 几乎 总 是 取 值 为 1。 

sem_flags 参 数 是 一 组 标志 ， 它 与 open 函 数 的 标志 非常 相似 。 它 低 端 
的 9 个 比特 是 该 信号 量 的 权限 ， 其 作用 类 似 于 文件 的 访问 权限 。 此 外 ， 
它们 还 可 以 和 值 IPC_CREAT 做 按 位 或 操作 ， 来 创建 一 个 新 信号 量 。 即 
使 在 设置 了 IPC_CREAT 标 志 后 给 出 的 键 是 一 个 已 有 信号 量 的 键 ， 也 不 
会 产生 错误 。 如 果 函 数 用 不 到 IPC_CREAT 标 志 ， 该 标志 就 会 被 悄悄 地 
忽略 掉 。 我 们 可 以 通过 联合 使 用 标志 IPC_CREAT 和 ” IPC_EXCL 来 确保 
ene reenter ree 
一 个 错误 。 

semget 函 数 在 成 功 时 返回 一 个 正 数 〈 非 零 ) 值 ， 它 就 是 其 他 信号 量 
函数 将 用 到 的 信号 量 标识 符 。 如 果 失 败 ， 则 返回 -1。 

2. semop 函 数 

semop 函 数 用 于 改变 信号 量 的 值 ， 它 的 定义 如 下 所 示 : 

第 一 个 参数 sem_id 是 由 semget 返 回 的 信号 量 标识 符 。 第 二 个 参数 
sem_ops 是 指向 一 个 结构 数组 的 指针 ， 每 个 数组 元 素 至 少 包含 以 下 几 个 


成 员 : 
struct sembuf { 
short sem num; 
short sem op; 
short sem flg; 


} 

第 一 个 成 员 sem_num 是 信号 量 编写， 除非 你 需要 使 用 一 组 信号 量 ， 
否则 它 的 取 值 一 般 为 0。sem_op 成 员 的 值 是 信号 量 在 一 次 操作 中 需要 改 
变 的 数值 〈 你 可 以 用 一 个 非 1 的 数值 来 改变 信号 量 的 值 ) 。 通 常 只 会 用 
到 两 个 值 ， 一 个 是 -1， 也 就 是 P 操 作 ， 它 等 待 信号 量变 为 可 用 ; 一 个 是 
+1， 也 就 是 V 操 作 ， 它 发 送信 号 表示 信和 号 量 现在 已 可 用 。 

最 后 一 个 成 员 sem_flg 通 常 被 设置 为 SEM_UNDO。 它 将 使 得 操作 系 


统 跟踪 当前 进程 对 这 个 信号 量 的 修改 情况 ， 如 果 这 个 进程 在 没有 释放 该 
言 号 量 的 情况 下 终止 ， 操 作 系 统 将 自动 释放 该 进程 持 有 的 信号 量 。 除 非 
你 对 信号 量 的 行为 有 特殊 的 要 求 ， 否 则 应 该 养 成 设置 sem_flg 为 
SEM_UNDO 的 好 习惯 。 如 果 决 定 使 用 一 个 非 SEM_UNDO 的 值 ， 那 就 一 
定 要 注意 保持 设置 的 一 任性 ， 否 则 你 很 可 能 会 搞 不 清楚 内 核 是 否 会 在 进 
程 退 出 时 清理 信号 量 。 

semop 调 用 的 一 切 动作 都 是 一 次 性 完成 的 ， 这 是 为 了 避免 出 现 因 使 
人 

| 

3. semctl iK žr 

semctl 函 数 用 来 直接 控制 信号 量 信 息 ， 它 的 定义 如 下 所 示 : 


int semctl(int sem_id, int sem_num, int command, ...); 


第 一 个 参数 sem_id 是 由 semget 返 回 的 信号 量 标识 符 。sem_num 人 参数 
是 信号 量 编号 ， 当 需要 用 到 成 组 的 信号 量 时 ， 就 要 用 到 这 个 参数 ， 它 一 
般 取 值 为 0， 表 示 这 是 第 一 个 也 是 唯一 的 一 个 信号 量 。command 参 数 是 
将 要 采取 的 动作 。 如 果 还 有 第 四 个 参数 ， 它 将 会 是 一 个 union ”semun 结 
构 ， 根 据 X/OPEN 规 范 的 定义 ， 它 至 少 包含 以 下 几 个 成 员 : 


union semun { 
int val; 
struct semid_ds *buf; 
unsigned short *array; 


} 


虽然 X/Open 规范 中 指出 ，semun 联 合 结构 必须 由 程序 员 自 己 定义 ， 
但 大 多 数 Linux 版 本 会 在 某 个 涉 文 件 (一 般 是 sem.h)〉 中 给 出 该 结构 的 定 
义 。 如 果 你 发 现 确 实 需 要 自己 来 定义 该 结构 ， 请 查阅 Semctl 的 手册 页 ， 
看 手册 中 是 人 否 已 给 出 了 定义。 如 果 有 ， 我 们 建议 使 用 手册 中 给 出 的 定 
义 ， 即 使 它 与 这 里 给 出 的 定义 不 一 致 也 应 该 如 此 。 

semct 函 数 中 的 command 参 数 可 以 设置 许多 不 同 的 值 ， 但 只 有 下 面 
介绍 的 两 个 值 最 常用 。semctl 函 数 的 完整 细节 请 查阅 它 的 手册 页 。 

O SETVAL: 用 来 把 信号 量 初始 化 为 一 个 已 知 的 值 。 这 个 值 通 过 

union semun 中 的 val 成 员 设置 。 其 作用 是 在 信号 量 第 一 次 使 用 之 前 

对 它 进行 设置 。 

O IPC_RMID: 用 于 删除 一 个 已 经 无 需 继续 使 用 的 信号 量 标识 符 。 


semctl eh BUR AE HG command# AHA E A LN BEL. PF 
SETVAL 和 IPC_RMID， 成 功 时 返回 0， 失 败 时 返回 -1。 


14.1.4 aoe 


从 上 一 市 的 介绍 可 以 看 出 ， 信 号 量 的 操作 相当 复杂 。 这 可 不 是 一 个 
好 消 轧 ， 因 为 编写 包含 临界 区 域 的 多 进程 或 多 线程 程序 本 身 束 是 一 件 非 
营 困 难 的 事情 ， 再 加 上 一 个 如 此 复杂 的 编程 接口 ， 这 就 更 增添 了 编程 者 
的 精神 负担 。 

笠 运 的 是 ， 大 部 分 需要 使 用 信号 量 来 解决 的 问题 只 需 使 用 一 个 最 简 
单 的 二 进 制 信和 号 量 即 可 。 在 下 面 的 例子 中 ， 我 们 将 用 完整 的 编程 接口 为 
二 进 制 信号 量 创 建 一 个 简单 得 多 的 PV 类 型 接口 ， 然 后 用 这 个 非常 简单 
的 接口 来 演示 信号 量 是 如 何 工作 的 。 

我 们 将 用 程序 seml.c 来 试验 信号 量 ， 该 程序 可 以 被 多 次 调用 。 我 们 
通过 一 个 可 选 的 参数 来 指定 程序 古 负 责 创建 信号 量 偿 是 负责 删除 信号 
里 


我 们 用 两 个 不 同 字符 的 输出 来 表示 进入 和 离开 临界 区 域 。 如 果 程 序 
局 动 时 带 有 一 个 参数 ， 它 将 在 进入 和 退出 临界 区 域 时 打印 字符 x; 而 程 
序 的 其 他 运行 实例 将 在 进入 和 退出 临界 区 域 时 打印 字符 0o。 因 为 在 任 一 
ao 一 个 进程 可 以 进入 临界 区 域 ， 所 以 字符 x 和 o 应 该 是 成 
对 出 现 的 。 


X 验 信号 量 

(1) 在 包含 了 必需 的 系统 头 文件 之 后 ， 我 们 包含 了 头 文件 
semun.h。 如 果 系 统 头 文件 sys/sem.h 没 有 定义 X/OPEN 规 范 所 需 的 联合 
semun， 这 个 头 文件 包含 了 对 它 的 定义 。 然 后 是 函数 原型 的 声明 和 全 局 
变量 的 定义 ， 接 着 束 到 了 main 函 数 的 定义 。 我 们 调用 semget 来 创建 一 个 
信号 量 ， 该 函数 将 返回 一 个 信号 量 标识 符 。 如 果 程 序 是 第 一 个 被 调用 的 
(也 就 是 说 它 在 被 调用 时 带 有 一 个 参数 ， 使 得 argc>1) ， 束 调用 


set_semvalue 初 始 化 信号 量 并 将 op_char 设 置 为 x: 


include h> 

fincluce h> 
#include <std h> 
finclr ser 
#includ mur 
static et mva id 
tatic i del_semval id 
stati t semaphore_s d) 
stati t semaphore ) 


int 
int 4 
“hy; 
srand( {unsigned getpid 
„id 3 et((key_t CREA’ 
if (a 


(2) Be PORE MIA, CEAMARA Ili FE LOUK. TERE 


es H citi Flsemaphore_p/i 数 ， 它 在 程序 将 进入 临界 区 域 时 设 
ieee ee 


for i 
( ! semap „p xit (EXIT_FAILURE 
printf ("tc p_char);f ut) 
pause_time anad{) % 
sleep (pause_time) ; 
printt("% p_char) ; fflush(stdou ut 


(3) 在 临 界 区 域 之 后 ， 调用 semaphore v 来 将 信号 量 设置 为 可 用 ， 


AH JTA 
然后 等 竺 一段 随 机 的 时 间 ， 再 进入 下 一 次 循环 。 在 整个 循环 语句 执行 完 
毕 后 ， T. semvalue 函 数 来 清理 代码 : 


(4) 函数 Set semvalue 通 过 将 semctl 调 用 的 command 参 数 设 置 为 
SETVAL 来 初始 化 信号 量 。 在 使 用 信号 量 之 前 必须 要 这 样 做 : 


(5) 函数 del_semvalue 的 形式 与 上 面 的 函数 几乎 一 样 ， 只 不 过 它 通 
过 将 semct 调 用 的 command 设 置 为 IPC_RMID 来 删除 信和 号 量 ID: 


stderr "Failed to delete semaphore\n"); 


(6) semaphore_p 对 信号 量 做 减 1 操作 〈 等 待 ) : 


(7) ”semaphore_v 和 semaphore_p 类 似 ， 不 同 的 是 它 将 sembuf 结 构 
中 的 sem_op 设 置 为 1。 这 是 一 个 “释放 ”操作 ， 它 使 信号 量变 为 可 用 : 


注意 ， 这 个 简单 的 程序 只 允许 每 个 程序 有 一 个 二 进 制 信号 量 。 虽 然 
我 们 可 以 通过 传递 信号 量变 量 的 方法 来 扩展 它 以 文 持 更 多 的 信号 量 ， 但 
通常 一 个 二 进 制 信号 量 即 已 足够 。 

我 们 可 以 通过 多 次 局 动 这 个 程序 的 方法 来 对 它 进行 测试 。 第 一 次 局 
动 时 加 上 一 个 参数 ， 表 示 应 该 由 它 来 负责 创建 和 删除 信号 量 。 其 他 的 调 
用 实例 不 使 用 参数 。 

下 面 是 两 个 程序 调用 实例 时 的 一 些 样本 输出 : 


$ cc seml.c -o semi 


5 ./seml 
OOXXOOXXOOXXOOXXOOXXOOOOXXOOXX00} XXOOXXXX 
1083 - finishe 

082 - finished 


请 记 住 ， 字 符 “O” 和 “X” 分 别 代表 程序 的 第 一 个 和 第 二 个 调用 实 
例 。 因 为 每 个 程序 都 在 其 进入 和 离开 临界 区 域 时 打印 一 个 字符 ， 所 以 每 
个 字符 都 应 该 成 对 出 现 。 如 你 所 见 ， 字 符 o 和 x 是 成 对 出 现 的 ， 这 表明 对 
临界 区 域 的 处 理 是 正确 的 。 如 果 这 个 程序 在 你 的 系统 上 不 能 正常 工作 ， 
你 可 能 需要 在 启动 程序 之 前 执行 命令 stty -tostop， 以 确保 产生 tty 输 出 的 
后 台 程 序 不 会 引发 系统 生成 一 个 信号 。 

实验 解析 

在 程序 的 开始 ， 我 们 用 semget 函 数 通过 一 个 〈 随 意 选取 的 ) 键 来 取 
得 一 个 信号 量 标识 符 。 IPC_CREAT 标 志 的 作用 是 : 如 果 信 和 号 量 不 存 
在 ， 就 创建 它 。 

如 果 程 序 带 有 一 个 参数 ， 它 就 负责 信号 量 的 初始 化 工作 ， 这 是 通过 
set _semvalue 函 数 来 完成 的 ， 访 函数 是 针对 更 通用 的 semct 函 数 的 简化 接 
口 。 程 序 还 将 根据 是 否 带 有 参数 来 决定 需要 打印 哪个 字符 。sleep 函 数 的 
作用 是 ， 让 我 们 有 了 时间 在 这 个 程序 实例 执行 太 多 次 循环 之 前 调用 其 他 的 
程序 实例 。 我 们 用 函数 srand 和 rand 来 为 程序 引入 一 些 伪 随机 形式 的 时 间 
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接 下 来 程序 循环 10 次 ， 在 临界 区 域 和 非 临 界 区 域 会 分 别 暂停 一 段 随 
机 的 时 间 。 临 界 区 域 由 semaphore_p 和 semaphore_v 函 数 前 后 把 守 ， 它 们 
是 更 通用 的 semop 函 数 的 简化 接口 。 

删除 信号 量 之 前 ， 带 有 参数 启动 的 程序 会 进入 等 待 状态 ， 以 允许 其 
他 调用 实例 都 执行 完毕 。 如 果 不 删除 信号 量 ， 它 将 继续 在 系统 中 存在 ， 
即使 没有 程序 在 使 用 它 也 是 如 此 。 在 实际 的 编程 中 ， 我 们 需要 特别 小 
心 ， 不 要 无 意 之 中 在 执行 结束 之 后 还 留 下 信号 量 未 删除 。 它 可 能 会 在 你 
而 且 信 和 号 量 也 是 一 种 有 限 的 资源 ， 需 要 大 
RZ : 


14.2 E 


共享 内 存 是 3 个 IPC 机 制 中 的 第 二 个 。 它 允许 两 个 不 相关 的 进程 访问 
同一 个 逻辑 内 存 。 共享 内 存 是 在 两 不 正在 运行 的 进程 之 间 传 递 数 据 的 一 
种 非常 有 效 的 方式 。 虽 然 XOpen 标 准 并 没有 对 它 做 出 要 求 ， 但 大 多 数 共 
都 把 由 不 同 进 程 之 间 共 享 的 内 存 安 排 为 同一 段 物 理 

子 。 

共享 内 存 是 由 卫 C 为 进程 创建 的 一 个 特殊 的 地 址 范围 ， 它 将 出 现在 
该 进程 的 地 址 空间 中 。 其 他 进程 可 以 将 同一 段 共 享 内 存 连 接 到 它们 目 己 
的 地 址 空间 中 。 所 有 进程 都 可 以 访问 共享 内 存 中 的 地 址 ， 就 好 像 它们 是 
由 malloc 分 配 的 一 样 。 如 果菜 个 进程 同 共 享 内 存 写 入 了 数据 ， 所 做 的 改 
动 将 立刻 被 可 以 访问 同一 段 共 享 内 存 的 任何 其 他 进程 看 到 。 

共享 内 存 为 在 多 个 进程 之 间 共 享 和 传递 数据 提供 了 一 种 有 效 的 方 
式 。 由 于 它 并 未 提供 同步 机 制 ， 所 以 我 们 通常 需要 用 其 他 的 机 制 来 同步 
对 共享 内 存 的 访问 。 我 们 一 般 是 用 共享 内 存 来 提供 对 大 块 内 存 区 域 的 有 
效 访 问 ， 同 时 通过 传递 小 消息 来 同步 对 该 内 存 的 访问 。 

在 第 一 个 进程 结束 对 共享 内 存 的 写 操作 之 前 ， 并 无 自动 的 机 制 可 以 
阻止 第 二 个 进程 开始 对 它 进 行 读 取 。 对 共享 内 存 访问 的 同步 控制 必须 由 
程序 员 来 负责 。 图 14-2 显 示 了 共享 内 存 是 如 何 工 作 的 。 
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图 14-2 
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关系 。 实 际 情况 要 比 图 中 显示 的 更 加 复杂 ， 因 为 可 用 内 存 实际 上 由 物理 
内 存 和 已 交换 到 磁盘 上 的 内 存 页 面 混合 组 成 。 

共 吝 内存 使 用 的 函数 类 似 于 信号 量 的 函数 ， 它 们 的 定义 如 下 : 


#include <sys/shm.h> 


void *shmat(int shm_id, const void *shm_addr, int shmflg); 
int shmctl(int shm_id, int cmd, struct shmid ds *buf); 
int shmdt(const void *shm_addr); 
int shmget (key t key, size_t size, int shmflg); 
与 信号 量 的 情况 一 样 ， 头 文件 sysMtypes.hn 和 sys/ipc.h 通 常 被 shm.h 自 
动 包含 进程 序 。 


14.2.1 shmgetphi2 
我 们 用 shmget 函 数 来 创建 共享 内 存 : 


int shmget(key t key, size_t size, int shmflg) ; 


与 信号 量 一 样 ， 程 序 需 要 提供 一 个 参数 key， 它 有 效 地 为 共享 内 存 
段 俞 名 ，shmget 函 数 返 回 一 个 共享 内 存 标 识 符 ， 该 标识 符 将 用 于 后 续 的 
共享 内 存 函 数 。 有 一 个 特殊 的 键 值 IPC_PRIVATE， 它 用 于 创建 一 个 只 
属于 创建 进程 的 共享 内 存 。 通 常 你 不 会 用 到 这 个 值 ， 而 且 你 可 能 会 发 现 
在 一 些 Linux 系 统 中 ， 私 有 的 共享 内 存 其 实 并 不 是 真正 的 私有 。 

第 二 个 参数 size 以 字 节 为 单位 指定 需要 共享 的 内 存 容 量 。 

第 三 个 参数 shmflg 包 含 9 个 比特 的 权限 标志 ， 它 们 的 作用 与 创建 文 
件 时 使 用 的 mode 标 志 一 样 。 由 IPC_CREAT 定 义 的 一 个 特殊 比特 必须 和 
权限 标志 按 位 或 才能 创建 一 个 新 的 共享 内 存 段 。 设 置 IPC_CREAT 标 志 
的 同时 ， 给 shmget 函 数 传递 一 个 已 有 共享 内 存 段 的 键 并 不 是 一 个 错误 ， 
如 果 无 需 用 到 IPC_CREAT 标 志 ， 该 标志 就 会 被 悄悄 地 忽略 掉 。 

权限 标志 对 共享 内 存 非常 有 用 ， 因 为 它们 允许 一 个 进程 创建 的 共享 
内 存 可 以 被 共享 内 存 的 创建 者 所 拥有 的 进程 写 入 ， 同 时 其 他 用 户 创建 的 
进程 只 能 读 取 该 共享 内 存 。 我 们 可 以 利用 这 个 功能 来 提供 一 种 有 效 的 对 
数据 进行 只 读 访 问 的 方法 ， 通 过 将 数据 放 入 共享 内 存 并 设置 它 的 权限 ， 
就 可 以 避免 数据 被 其 他 用 户 修改 。 

如 果 共 享 内 存 创 建成 功 ，shmget 返 回 一 个 非 负 整数 ， 即 共享 内 存 标 
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第 一 次 创建 共享 内 存 段 时 ， 它 不 能 被 任何 进程 访问 。 要 想 局 用 对 该 
共有 至 内 存 的 访问 ， 必 须 将 其 连接 到 一 个 进程 的 地 址 空间 中 。 这 项 工作 由 
shmat 函 数 来 完成 ， 它 的 定义 如 下 所 示 : 


void *shmat(int shm id, const void *shm_addr, int shmflg); 


第 一 个 参数 shm_id 是 由 shmget 返 回 的 共享 内 存 标识 符 。 

第 二 个 参数 shm_addr 指 定 的 是 共享 内 存 连接 到 当前 进程 中 的 地 址 位 
置 。 它 通常 是 一 个 空 指 针 ， 表 示 让 系统 来 选择 共享 内 存 出 现 的 地 址 。 

第 三 个 参数 shmflg 是 一 组 位 标志 。 它 的 两 个 可 能 取 值 是 
SHM_RND (这 个 标志 与 shm_addr 联 合 使 用 ， 用 来 控制 共享 内 存 连接 的 
地 址 ) 和 SHM_RDONLY ( 它 使 得 连接 的 内 存 只 读 ) 。 我 们 很 少 需要 控 
制 共 享 内 存 连 接 的 地 址 ， 通 常 都 是 让 系统 来 选择 一 个 地 址 ， 否 则 就 会 使 
应 用 程序 对 硬件 的 依赖 性 过 高 。 

如 果 shmat 调 用 成 功 ， 它 返回 一 个 指 癌 共 享 内 存 第 一 个 字 节 的 指 
针 ; 如 果 失 败 ， 它 就 返回 -1。 


共享 内 存 的 读 写 权限 由 它 的 属 主 〈 共 享 内 存 的 创建 者 ) 、 它 的 访问 
权限 和 当前 进程 的 属 主 决 定 。 共 享 内 存 的 访问 权限 类 似 于 文件 的 访问 权 
限 。 

这 个 规则 的 一 个 例外 是 ， 当 shmflg & SHM_RDONLY 为 tue 时 的 情 
况 。 此 时 即使 该 共享 内 存 的 访问 权限 允许 写 操作 ， 它 都 不 能 被 写 入 。 


14.2.3 shmdt 
shmdt 函 数 的 作用 是 将 共享 内 存 从 当前 进程 中 分 离 。 它 的 参数 是 


shmat 返 回 的 地 址 指针 。 成 功 时 它 返 回 0， 失 败 时 返回 -1。 注 意 ， 将 共享 
内 存 分 离 并 未 删除 它 ， 只 是 使 得 该 共享 内 存 对 当前 进程 不 再 可 用 。 


14.2.4 shmctl 


与 复杂 的 信号 量 控制 函数 相 比 ， 共 享 内 存 的 控制 函数 (非常 感谢 ) 
要 稍微 简单 一 些 。 它 的 定义 如 下 所 示 : 
int shmctl(int shm_id, int command, struct shmid_ds *buf); 
shmid_ ds 结构 至 少 包 含 以 下 成 员 : 
SUTIUCT snmiq as į 
uid_t shm_perm.uid; 
uid_t shm_perm.gid; 
mode 七 shm_perm.mode; 


} 

第 一 个 参数 shm_id 是 shmget 返 回 的 共享 内 存 标识 符 。 

第 二 个 参数 command 是 要 采取 的 动作 ， 它 可 以 取 3 个 值 ， 如 表 14-2 
所 示 。 

表 14-2 
人 7 说 g 
+ 2 结构 中 的 数据 设置 为 共享 内 存 的 当前 关联 值 
名 果 进 程 有 足够 的 权限 ， 就 把 共享 内 存 的 类 前 关联 值 设 置 为 shmid_ds 关 构 中 给 出 的 值 
C_RM RRP ER 
lead 它 指向 包含 共享 内 存 模式 和 访问 权限 
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成 功 时 返回 0， 失 败 时 返回 -1。X/Open 规 范 没 有 定义 当 你 试图 删除 
一 个 正 处 于 连接 状态 的 共享 内 存 段 时 将 会 发 生 的 情况 。 通 常 这 个 已 经 被 
删除 的 处 于 连接 状态 的 共享 内 存 段 还 能 继续 使 用 ， 直 到 它 从 最 后 一 个 进 
程 中 分 离 为 止 。 但 因为 这 个 行为 并 未 在 规范 中 定义 ， 所 以 最 好 不 要 依赖 
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介绍 完 共 享 内 存 函 数 后 ， 我 们 可 以 编写 一 些 代码 来 使 用 它们 。 在 这 
个 实验 中 - 我 们 将 编写 一 对 程序 shm1.c 和 shm2.c。 第 一 个 程序 消费 
者 ) 将 创建 一 个 共享 内 存 段 ， 然 后 把 写 到 它 里 面 的 数据 都 显示 出 来 。 
real F CAPR) 将 连接 一 个 已 有 的 共享 内 存 段 ， 并 允许 我 们 问 其 
al : 

C1) 我 们 首先 创建 一 个 公共 的 头 文 件 ， 来 定义 我 们 和 希望 分 发 的 共 
了 BATE RM shm_com.h: 


t shar od_use_st t ( 


by sa 
xt (TEX CT_SZ] ; 


XEEN 吉 构 在 消费 者 和 生产 者 程序 中 都 会 用 到 。 当 有 数据 写 入 
这 个 结构 时 ， 我 们 用 该 结构 中 的 一 个 整 型 标志 written_by_you 来 通知 消 
费 者 。 需 要 传输 的 文本 长 度 2K 是 由 我 们 随意 决定 的 。 

(2) 第 一 个 程序 shm1l.c 是 消费 者 程序 。 在 头 文 件 之 后 ， 通 过 设置 
SIPC _CREAT 标 志 位 的 shmget 调 用 来 创建 共 t 享 内 存 段 (其 长 度 就 是 我 
们 的 共享 内 存 结构 的 长 度 ) : 


#include < td. h> 
#include ib.h> 
include <stdio.h> 
include <string.h> 


(3) 现在 ， 让 程序 可 以 访问 这 个 共享 内 存 : 


shared_memory = shmat(shmid, (void *)0, 0); 
if (shared_memory == (void *)-1) { 


fprintf(stderr, "shmat failed\n"); 
exit (EXIT_FAILURE) ; 


printf£("Memory attached at $X\n*, ({int)shared_memory) ; 


(4) 程序 的 下 一 部 分 将 shared_memory 分 配给 shared_stuff， 然 后 它 
输出 written_by_you 中 的 文本 。 循 环 将 一 直 执 行 到 在 written_by_you 中 找 
到 end 字 符 串 为 止 。sleep 调 用 强迫 消费 者 程序 在 临界 区 域 多 竺 一 会 儿 ， 
让 生产 者 程序 等 行 : 


shared_stuff = (struct shared_use_st *)shared_memory; 
shared_stuff->written_by_you = 0; 
while(running) i 
if (shared_stuff->written_by_you) { 

printf (*You wrote: $s", shared_stuff->some_text) ; 

sleep( rand() 8 4}; /* make the other process wait for us 

shared_stuff->written_by_you = 0; 

if {strncomp(shared_stuff->some_text, "end", 3) 0) { 


running = 0; 


5) 最 后 ， 共 孚 内 存 被 分 离 ， 然 后 家 删除 


f {shwdr (shared meso w= =l) 
fprintf(stderr, “ake failed\n"); 
exit (EXIT_FAILURE) ; 


if {shmctl{(shmid, IPC_RMID, 0) == -1) { 
fprintf(stderr, “shmct TER RMID) failed\n*); 
exit (EXIT _PAILURE) ; 


exit (EXIT_SUCCESS) ; 


(6) 第 二 个 程序 shm2.c 是 生产 者 程序 ， 我 们 通过 它 向 消费 者 程序 
输入 数据 。 它 与 shm1.c 很 相似 ， 程 序 代 码 如 下 所 示 : 


@include <unistd.h> 
include <stdlib.h> 
#include <stdio.h> 
Sinclude <string.h> 


finclude <sys/shm.h> 
#include *shm_com.h* 


int main() 

{ 
int running = 1; 
void *shared_memory = (void *)0; 
struct shared_use_st *shared_stuff; 
char buffer [BUFSIZ); 
int shmid; 


shmid = shmget((key_t)1234, sizeof(struct shared_use_st), 0666 | IPC_CREAT); 


if (shmid == -1) { 
fprintf(stderr, "shmget failed\n"); 
exit (EXIT_FAILURE) ; 
} 
shared memory = shmat(shmid, {void *)0, 0); 
if (shared_memory == (void *)-1) { 
fprintf(stderr, "shmat failed\n"); 
exit (EXIT_FAILURE) ; 
} 


print£("Memory attached at @X\n", (int) shared_menory); 


shared_stuff = (struct shared_use_st *)shared_memory; 
while(running) 【 
while(shared_stuff->written_by_you == 1) { 
sleep(1); 
printf ("waiting for client...\n"}; 
} 
printf(*inter some text: *); 
fgetsi(buffer, BUFSIZ, stdin); 


strncpy (shared_stuff->some_text, buffer, TEXT_SZ); 
shared_stuff->written_by_you = 1; 


if (strnemp(buffer, "enà", 3) == 0) { 
running = 0; 
} 
} 


if (shmdt(shared_memory) == -1) { 
fprintf(stderr, *shmdt failed\n"); 
exit (EXIT_FAILURE) ; 

} 

exit (EXIT_SUCCESS) ; 


运行 这 些 程序 时 ， 我 们 将 看 到 如 下 所 示 的 样本 输出 : 


Memory atta 4001700C 
-/shm2 
Memory attached at 40017 
Enter some text: hello 
u wrote: hello 
waiting for client. 
waiting for client. 
Enter some text: Linux! 
U Wro Linux! 
aiting client 
aiting cli 
waiting client 


You wrote: end 


实验 解析 

第 一 个 程序 shm1 创 建 共 享 内 存 段 ， 然 后 将 它 连 接 到 上 自己 的 地 址 空间 
中 。 我 们 在 共享 内 存 的 开始 处 使 用 了 一 个 结构 shared_use_st。 访 结构 中 
有 个 标志 written_by_you， 当 共享 内 存 中 有 数据 写 入 时 ， 就 设置 这 个 标 
志 。 这 个 标志 被 设置 时 ， 程 序 就 从 共享 内 存 中 读 取 文本 ， 将 它 打 印 出 
来 ， 然 后 清除 这 个 标志 表示 已 经 读 完 数据 。 我 们 用 一 个 特殊 字符 串 end 
来 退出 循环 。 接 下 来 ， 程 序 分 离 共享 内 存 段 并 删除 它 。 

第 二 个 程序 shm2 使 用 相同 的 键 1234 来 取得 并 连接 同一 个 共享 内 存 
段 。 然 后 它 提示 用 户 输入 一 些 文本 。 如 果 标 志 written_by_you 被 设置 ， 
shm2 就 知道 客户 进程 还 未 读 完 上 一 次 的 数据 ， 因 此 惑 继 续 等 待 。 当 其 他 
进程 清除 了 这 个 标志 后 ，shm2 写 入 新 数据 并 设置 该 标志 。 它 还 使 用 字符 
串 end 来 终止 并 分 离 共 享 内 存 段 。 

注意 ， 我 们 只 能 提供 自己 的 、 非 常 简陋 的 同步 标志 
written_by_you， 它 包括 一 个 非常 缺乏 效率 的 忙 等 待 〈 不 停 地 循环 ) 。 
这 可 以 使 得 我 们 的 示例 比较 简单 ， 但 在 实际 编程 中 ， 我 们 应 该 使 用 信和 号 
量 或 通过 传递 消息 〈 使 用 管道 或 ITPC 消 息 ， 后 者 我 们 在 下 一 节 就 会 谈 
到 ) 、 生 成 信号 〈 在 第 11 章 介绍 的 ) 的 方法 来 提供 应 用 程序 读 、 写 部 分 
之 间 的 一 种 更 有 效率 的 同步 机 制 。 


14.3 ”消息 队列 


我 们 现在 来 学 习 第 三 个 也 是 最 后 一 个 System VIPC 机 制 : 消息 队列 
(message queue) 。 消 息 队 列 与 命名 管道 有 许多 相似 之 处 ， 但 少 了 在 打 
开 和 关闭 管道 方面 的 复杂 性 。 但 使 用 消息 队列 并 未 解雇 我们 在 使 用 命名 
管道 时 遇 到 的 一 些 问 题 ， 比 如 管道 满 时 的 阻塞 问题 。 

消息 队列 提供 了 一 种 在 两 个 不 相关 的 进程 之 间 传 递 数据 的 相当 人 简单 
且 有 效 的 方法 。 与 命名 管道 相 比 ， 消 息 队 列 的 优势 在 于 ， 它 独立 于 发 送 
和 接收 进程 而 存在 ， 这 消除 了 在 同步 命名 管道 的 打开 和 关闭 时 可 能 产生 
的 一 些 困难 。 

消息 队列 提供 了 一 种 从 一 个 进程 癌 另 一 个 进程 发 送 一 个 数据 块 的 方 
法 。 而 且 ， 每 个 数据 块 都 被 认为 含有 一 个 类 型 ， 接 收 进程 可 以 独立 地 接 
收 含 有 不 同类 型 值 的 数据 块 。 好 消息 是 ， 我 们 可 以 通过 发 送 消息 来 几 平 
完全 避免 命名 管道 的 同步 和 阻塞 问题 。 更 好 的 是 ， 我 们 可 以 用 一 些 方法 
来 提前 查看 紧急 消息 。 坏 消息 是 : 与 管道 一 样 ， 每 个 数据 块 都 有 一 个 最 
大 长 度 的 限制 ， 系 统 中 所 有 队列 所 包含 的 全 部 数据 块 的 总 长 度 也 有 一 个 


上 限 。 

虽然 X/Open 规 范 说 明 这 些 限制 是 强制 的 ， 但 它 并 未 提供 发 现 这 些 限 
制 的 方法 ， 只 是 告诉 我 们 超过 这 些 限 制 是 引起 一 些 消息 队列 函数 失败 的 
原因 之 一 。Linux 系 统 有 两 个 宏 定义 MSGMAX 和 MSGMNB， 它 们 以 字 
节 为 单位 分 别 定义 了 一 条 消息 的 最 大 长 度 和 一 个 队列 的 最 大 长 度 。 其 他 
系统 中 的 这 些 宏 定义 可 能 会 不 一 样 或 甚至 根本 就 不 存在 。 

消息 队列 函数 的 定义 如 下 所 示 : 


#include <sys/msg.h> 


int msgctl(int msgid, int cad, struct msqid_ ds *buf); 

int megget(key_t key, int msgflg); 

int msgrev(int msqid, void *msg_ptr, size_t msg_sz, long int msgtype, int msgfig); 
int msgend(int msqid, const void *msg_ptr, size_t msg_sz, int msgflg); 


与 信号 量 和 共享 内 存 一 样 ， 头 文件 sys/types.h 和 sys/ipc.h 通 常 被 
msg.h 自 动 包含 进程 序 。 


14.3.1 msggetpk 2 
我 们 用 msgget 函 数 来 创建 和 访问 一 个 消息 队列 : 


int msgget (key t key, int msgflg); 
与 其 他 IPC 机 制 一 样 ， 程 序 必须 提供 一 个 键 值 来 命名 某 个 特定 的 消 


娠 队列 。 特 殊 键 值 IPC_PRIVATE 用 于 创建 私有 队列 ， 从 理论 上 来 说 ， 
它 应 该 只 能 被 当前 进程 访问 ， 但 同 信号 量 和 共享 内 存 的 情况 一 样 ， 消 息 
队列 在 某 些 Linux 系 统 中 事实 上 并 非 私 有 。 由 于 私有 队列 没有 什么 用 
处 ， 所 以 这 并 不 是 一 个 很 严重 的 问题 。 与 以 前 一 样 ， 第 二 个 参数 msgflg 
由 9 个 权限 标志 组 成 。 由 IPC_CREAT 定 义 的 一 个 特殊 位 必须 和 权限 标志 
按 位 或 才能 创建 一 个 新 的 消息 队列 。 在 设置 IPC_CREAT 标 志 时 ， 如 果 
给 出 的 是 一 个 已 有 消息 队列 的 键 也 不 会 产生 错误 。 如 果 消 息 队 列 已 有 ， 
则 IPC_CREAT 标 志 就 被 悄悄 地 忽略 掉 。 

成 功 时 msgget 函 数 返 回 一 个 正 整 数 ， 即 队列 标识 符 ， 失 败 时 返 
回 -1。 


14.3.2 msgsnd phi 2 
msgsnd 函 数 用 来 把 消息 添加 到 消息 队列 中 : 


int msgsnd(int msqid, const void *msg_ptr, size_t msg_sz, int msgflg); 
消息 的 结构 受到 两 方面 的 约束 。 首 先 ， 它 的 长 度 必须 小 于 系统 规定 
的 上 限 ， 其 次 ， 它 必须 以 一 个 长 整 型 成 员 变量 开始 ， 接 收 函 数 将 用 这 个 
成 员 变 量 来 确定 消息 的 类 型 。 当 使 用 消息 时 ， 最 好 把 消 结 构 定 义 为 下 
面 这 样 : 
struct my message { 
long int message type; 
/* The data you wish to transfer */ 


} 

由 于 在 消息 的 接收 中 要 用 到 message_type， 所 以 你 不 能 忽略 它 。 你 
_ 自己 的 数据 结构 时 包含 它 ， 并 且 最 好 将 它 初始 化 为 一 个 已 知 

第 一 个 参数 msqid 是 由 msgget 函 数 返 回 的 消息 队列 标识 符 。 

第 二 个 参数 msg_ptr 是 一 个 指 回 准备 发 送 消息 的 指针 ， 消 息 必 须 像 
刚才 说 的 那样 以 一 个 长 整 型 成 员 变 量 开始 。 

第 三 个 参数 msg_sz 是 msg_ptr 指 同 的 消 恩 的 长 度 。 这 个 长 度 不 能 
括 长 整 型 消息 类 型 成 员 变 量 的 长 度 。 

第 四 个 参数 msgflg 控 制 在 当前 消息 队列 满 或 队列 消息 到 达 系 统 范围 
的 限制 时 将 要 发 生 的 事情 。 如 果 msgflg 中 设置 了 IPC_NOWAIT 标 志 ， 池 
数 将 立刻 返回 ， 不 发 送 消息 并 且 返 回 值 为 -1。 如 果 msgflg 中 的 
IPC_NOWAIT 标 志 被 清除 ， 则 发 送 进程 将 挂 起 以 等 待 队列 中 膳 出 可 用 空 
GE 


成 功 时 这 个 函数 返回 9， 失 败 时 返回 -1。 如 果 调 用 成 功 ， 消 因数 据 


的 一 份 副本 将 被 放 到 消 妃 队列 中 。 


14.3.3 ”msgrcv 函 数 
msgrcvP&l RMN A 队列 中 获取 消 A : 


第 一 个 参数 msqid 是 由 msgget 函 数 返 回 的 消息 队列 标识 符 。 

第 二 个 参数 msg_ptr 是 一 个 指 同 准备 接收 消 明 的 指针 ， 消 息 必须 像 
前 面 msgsnd 函 数 中 介绍 的 那样 以 一 个 长 整 型 成 员 变 量 开 始 。 

第 三 个 参数 msg_sz 是 msg_ptr 指 回 的 消息 的 长 度 ， 它 不 包括 长 整 型 
消息 类 型 成 员 变 量 的 长 度 。 

第 四 个 参数 msgtype 是 一 个 长 整数 ， 它 可 以 实现 一 种 简单 形式 的 接 
收 优先 级 。 如 果 msgtype 的 值 为 0， 就 获取 队列 中 的 第 一 个 可 用 消息 。 如 
果 它 的 值 大 于 零 ， 将 获取 具有 相同 消息 类 型 的 第 一 个 消息 。 如 果 它 的 值 
小 于 零 ， 将 获取 消息 类 型 等 于 或 小 于 msgtype 的 绝对 值 的 第 一 个 消息 。 

这 个 函数 看 起 来 好 像 很 复杂 ， 但 实际 应 用 时 很 简单 。 如 果 只 想 按 照 
消息 发 送 的 顺序 来 接收 它们 ， 就 把 msgtype 设 置 为 0。 如 果 只 想 获取 某 一 
特定 类 型 的 消息 ， 就 把 msgtype 设 置 为 相应 的 类 型 值 。 如 果 想 接收 类 型 
等 于 或 小 于 n 的 消息 ， 就 把 msgtype 设 置 为 -n。 

第 五 个 参数 msgflg 用 于 控制 当 队 列 中 没有 相应 类 型 的 消息 可 以 接收 
时 将 发 生 的 事情 。 如 果 msgflg 中 的 IPC_NOWAIT 标 志 被 设置 ， 函 数 将 会 
立刻 返回 ， 返 回 值 是 -1。 如 果 msgflg 中 的 IPC_NOWAIT 标 志 被 清除 ， 进 
程 将 会 挂 起 以 等 待 一 条 相应 类 型 的 消息 到 达 。 

成 功 时 msgrcv 函 数 返 回放 到 接收 缓存 区 中 的 字 节 数 ， 消 息 被 复制 到 
由 msg_ptr 指 向 的 用 户 分 配 的 缓存 区 中 ， 然 后 删除 消息 队列 中 的 对 应 消 
息 。 失 败 时 返回 -1。 


14.3.4 msgctl ph 24 

最 后 一 个 消息 队列 函数 是 msgctl， 它 的 作用 与 共享 内 存 的 控制 函数 
非常 相似 : 
int msgctl(int msqid, int command, struct msqid ds *buf); 


msqid_ds 结 构 人 至少 包 含 以 下 成 员 : 


struct msqid ds { 
uid t msg_perm.uid; 
uid t msg_perm.gid 
mode t msg_perm.mode; 


第 一 个 参数 msqid 是 由 msgget 返 回 的 消息 队列 标识 符 。 
第 二 个 参数 command 是 将 要 采取 的 动作 。 它 可 以 取 3 个 值 ， 如 表 14- 
3 所 示 。 


表 14-3 
命令 说 y 
二 结构 中 的 数据 设置 为 消息 队列 的 当前 关联 信 
如 时 进程 有 足够 的 权限 ， 就 把 消息 队列 的 当前 关 王 将 设置 为 msqid_ds 结 构 中 给 出 的 侦 
FIRR LAA 
成 功 时 它 返回 0， 失 败 时 返回 -1。 如 果 删 除 消 息 队 列 时 ， 某 个 进程 正在 msgsnaq 或 ms rev 函数 中 等 


待 ， 这 两 个 隙 数 将 失 数 


成 功 时 它 返 回 0， 失 败 时 返回 -1。 如 果 删 除 消息 队列 时 ， 某 个 进程 
正在 msgsnd 或 msgrcv 函 数 中 等 待 ， 这 两 个 函数 将 失败 。 


sx 验 消息 队列 | 
介绍 完 消 息 队 列 的 定义 后 ， 我 们 来 看 它 的 实际 工作 情况 。 与 前 面 一 
样 ， 我 们 将 编写 两 个 程序 : msg1.c 用 于 接收 消息 ，msg2.c 用 于 发 送 消 
恩 。 我 们 将 允许 两 个 程序 都 可 以 创建 消息 队列 ， 但 只 有 接收 者 在 接收 完 
最 后 一 个 消息 之 后 可 以 删除 它 。 
(1) 下 面 是 接收 者 程序 msg1.c 的 代码 : 


include <stdlib.h> 
lude <stdio.h> 


上 
Sinclu 
Pinclu 
’ 
# 


int main{) 
{ 
int running = 1; 
int msgid; 
struct my_msg_st some_data; 
long int msg_to_receive = 0; 


(2) 首先 建立 消息 队列 : 


msgid = msgget | (key_t)1234, 0666 | IPC_CREAT); 


if (msgid == -1) { 
fprintf(stderr, “megget failed with error: d\n", errno); 
exit (EXIT_FAILURE) ; 

} 


(3) 然后 从 队列 中 获取 消息 ， 直 到 遇见 end 消 息 为 止 。 最 后 ， 删 除 
消息 队列 : 


while(running) { 
if (msgrev(msgid, (void *)&some_data, BUFSIZ, 
msg_to_receive, 0) == -1) { 
fprintf(stderr, "msgrcv failed with error: td\n", errno); 
exit (EXIT_FAILURE) ; 
} 
printf("*You wrote: ts", some_data.some_text) ; 
if (strncmp(some_data.some_text, "end", 3) == 0) { 
running = 0; 
) 
} 


if (msgctl (msgid, IPC_RMID, 0) == -1) { 
fprintf(stderr, "“msgctl(IPC_RMID) failed\n")}; 
exit (EXIT_FAILURE) ; 

} 


exit (EXIT_SUCCESS) ; 


(4) 发 送 者 程序 msg2.c 与 msgl.c 很 相似 。 在 main 函 数 的 变量 定义 
Eby, 删除 了 对 msg to_ receive 的 定义 并 把 它 奉 换 为 buffer[BUFSIZ]。 云 
挥 删 除 消 息 队 列 的 语句 ， 在 running 循 环 中 做 如 下 的 改动 。 我 们 现在 通过 
调用 msgsnd 来 发 送 用 户 输入 的 文本 到 消 恩 队列 中 。 下 面 是 msg2.c 的 代 
码 ， 阴 影 部 分 是 与 nsgl.c 不 同 的 地 方 : 


#include <stdlib.h> 
#include <stdio.h> 
#include <string.h> 
#include <errno.h> 
#include <unistd.h> 


#include <sys/msg.h> 
#define MAX TEXT 512 


struct my_msg_st { 


long int my_msg_type; 
char some_text (MAX_TEXT); 


int main{) 


int running = 1; 

struct my_msg_st some_data; 
int msgid; 

char buffer (BUFSIZ); 


msgid = msgget((key_t)1234, 0666 | IPC_CREAT); 


if {msgid == -1l) [ 
fprintf(stderr, "msgget failed with error: %d\n", errno}; 
exit (EXIT_PAILURE) ; 


whilejrunning) { 
printf("Enter some text: °); 
fgets (buffer, BUPSIZ, stdin); 
some_data.my_msg type = 1; 
strcepy(some_data,some_text, buffer); 


if (megendimsgid, (void *)&some_data, MAX_TEXT, 0) == -1) { 
fprintf(stderr, "msgsnd failed\n"); 
exit (EXIT_FAILURE) ; 
} 
if {strncmp(buffer, “end", 3) 0) { 
= 0; 
} 
} 


exit (EXIT_SUCCESS) ; 


与 管道 例子 不 同 ， 这 里 不 再 需要 由 进程 自己 来 提供 同步 方法 。 这 是 


消息 相对 于 管道 的 一 个 明显 优势 。 
假设 消息 队列 中 有 空间 ， 发 送 者 可 以 创建 队列 ， 放 一 些 数据 到 队列 
中 ， 然 后 在 接收 者 启动 之 前 就 退出 。 我 们 将 先 运 行 发 送 者 msg2。 下 面 是 
一 些 样本 输出 : 
$ ./msg2 
Enter some text: hello 
Enter some text: How are you today? 
Enter some text: end 
S$ ./msgi 
You wrote: hello 
You wrote: How are you today? 
You wrote: end 
$ 
实验 解析 
发 送 者 程序 通过 msgget 来 创建 一 个 消息 队列 ， 然 后 用 msgsnd 回 队列 
中 增加 消息 。 接 收 者 用 msgget 获 得 消息 队列 标识 符 ， 然 后 开始 接收 消 
息 ， 直 到 接收 到 特殊 的 文本 end 为 止 。 然 后 它 用 msgctl 来 删除 消息 队列 以 
完成 清理 工作 。 


14.4 CD vy HIEN 
现在 ， 我 们 可 以 用 在 本 章 中 学 到 的 IPC 机 制 来 修改 CD 数据 库 应 用 程 


我 们 可 以 使 用 这 3 种 IPC 机 制 的 不 同 组 合 方式 ， 但 考虑 到 需要 传递 的 
消息 非常 小 ， 所 以 直接 使 用 消息 队列 来 实现 请 求 和 啊 应 的 传递 应 该 是 比 
较 合 乎 情理 的 。 

如 果 需 要 传递 的 数据 量 很 大 ， 我 们 就 可 以 考虑 用 共享 内 存 来 传递 实 
际 数据 ， 再 用 信号 量 或 消息 来 传递 一 个 “ 令 牌 "去 通知 其 他 进程 共享 内 存 
中 的 数据 已 可 用 。 

消息 队列 的 接口 省 去 了 我 们 在 第 11 章 中 遇 到 的 问题 ， 那 时 我 们 需要 
在 数据 传递 过 程 中 两 个 进程 都 打开 管道 。 使 用 消息 队列 允许 一 个 进程 往 
队列 中 放 消 息 ， 即 使 这 个 进程 是 当前 该 队列 的 唯一 用 户 。 

唯一 需要 我 们 做 出 的 重要 决定 是 如 何 同 客 户 返 回 查 询 结 果 。 一 种 简 
单 的 做 法 是 让 服务 器 用 一 个 队列 ， 每 个 客户 用 一 个 队列 。 但 如 果 并 发 客 
户 数 太 大 ， 这 将 引起 问题 ， 因 为 需要 大 量 的 消息 队列 。 通 过 使 用 消息 中 
的 消息 ID 域 ， 就 可 以 允许 所 有 客户 只 使 用 一 个 队列 。 通 过 在 消息 中 使 用 
客户 进程 ID， 就 可 以 把 啊 应 消息 和 特定 的 客户 进程 联系 起 来 。 然 后 ， 
以 只 获取 那些 发 送 给 它 的 消息 ， 而 将 发 送 给 其 他 客户 的 消息 留 
王 队 列 中 。 

要 想 把 我 们 的 CD 数据 库 应 用 程序 转换 为 使 用 IPC 机 制 ， 只 需要 更 换 
第 13 章 代码 中 的 文件 pipe_imp.c。 在 以 下 几 页 内 容 中 ， 我 们 将 介绍 着 换 
文件 ipc_imp.c 中 的 核心 代码 。 


14.4.1 (EMR sé Pe 
首先 ， 需 要 更 新 服务 器 函数 。 


(1) 首先 ， 包 括 必要 的 头 文件 ， 声 明 一 些 消 筷 队列 的 键 ， 然 后 定 
义 一 个 用 来 保存 消 妃 数据 的 结构 : 


序 了 


(2) 两 个 文件 范围 的 变量 分 别 保存 msgget 函 数 返回 的 两 个 队列 标 
识 符 : 


(3) 我 们 让 服务 器 负责 创建 两 个 消息 队列 : 


erver_starting 


qid = msgget ( (key_t)SERVER_MQUEUE, 0666 PC_CREAT) ; 


(4) 服务 器 还 负责 在 退出 时 执行 清理 工作 。 服 务 器 结束 时 ， 我 们 
将 文件 范围 的 变量 设置 为 无 效 值 。 当 服务 器 在 调用 了 server_ending 后 还 
TAAL AGS SIN, 这 种 做 法 可 以 捕获 到 这 样 的 错误 。 


{ 


(5) 服务 需 读 函数 的 作用 是 : 从 队列 中 读 取 一 个 任 一 类 型 〈“ 即 来 
目 任 意 客 户 ) 的 消息 ， 返 回 消息 的 数据 部 分 〈 忽 略 消 妃 的 类 型 ) : 


nt read_request_f bt 
truct msg_passed my_msg 
$if DEBUG_TRACE 
prantt(*sd ead. q get 
tendif 
s id m. ptr 
rec_p my. al_m a 


return(1); 


(6) 发 送 啊 应 时 ， 用 客户 进程 ID 来 纺 址 消 轧 ， 客 户 进程 ID 存放 在 
客户 的 请 求 中 : 


( 
ct mag_passed my_msg; 
tif DEBUG_TRA 
printf("t nd resp. to.. p 
tendif 


my_msg.real_message = mess_to_send 


14.4.2 {5p pK 


接 痢 ， 修 改 客户 函数 。 

D 当 客 户 局 动 时 ， 它 需要 找到 服务 器 和 客户 队列 标识 符 。 客 户 
本 身 并 不 创建 队列 。 如 果 服 务 句 没有 运行 ， 这 个 函数 束 会 因 消 妃 队 列 不 
存在 而 失败 。 


JG TRACE 


(2) 与 服务 器 一 样 ， 当 客户 结束 时 ， 我 们 将 文件 范围 的 变量 设置 
为 无 效 值 。 客 户 在 调用 了 dlient_ending 之 后 还 试图 发 送 消息 时 ， 这 种 做 
法 就 可 以 捕获 到 这 样 的 错误 。 


(3) 为 了 发 送 消 妃 给 服务 器 ， 将 数据 存储 到 我 们 的 结构 中 。 注 
意 ， 我 们 必须 设置 消息 的 键 。 因 为 0 对 键 来 说 是 个 无 效 值 ， 而 如 果 不 对 
这 个 键 做 定义 就 意味 着 它 将 取 一 个 (显然 的 ) 随机 值 ， 如 果 碰 巧 这 个 值 
征 0 的 话 ， 这 个 函数 就 会 调用 失败 。 


DEBI A 
prir 1a 
é 
vd; 
BGS l my = 
per: j" 
retu 


(4) 当 客 户 从 服务 咒 获 取 一 个 消 妃 时 ， 它 用 目 己 的 进程 ID 来 只 接 
收 肥 送 给 它 的 消 恩 ， 而 忽略 发 送 给 其 他 客户 的 消息 。 


I 


fendait 


(5) 为 了 保持 与 pipe_imp.c 的 完全 兼容 ， 我 们 还 需要 定义 4 个 函 
数 。 但 在 新 程序 中 ， 这 些 函 数 是 空 的 ， 因 为 现在 已 经 不 再 需要 它们 在 使 
用 管道 时 实现 的 操作 了 。 


return 


我 们 现在 可 以 启动 服务 器 ， 它 在 后 台 完 成 实际 的 数据 存储 和 检索 。 
然后 运行 客户 程序 ， 它 通过 消 恩 连接 服务 右 。 

我 们 在 这 里 所 需要 做 的 就 是 将 第 11 章 中 的 接口 函数 替换 为 使 用 消息 
队列 的 实现 。 将 应 用 程序 转换 为 使 用 消息 队列 展示 了 IPC 消 息 队 列 的 强 
大 。 因 为 与 使 用 管道 的 程序 相 比 ， 我 们 需要 使 用 的 函数 更 少 了 ， 即 使 那 
些 仍然 需要 使 用 的 函数 也 比 它 们 以 前 的 实现 版 本 要 简单 得 多 。 


145 IPC 状态 命令 


虽然 X/Open 规范 并 没有 定义 它们 ， 但 大 多 数 Linux 系 统 都 提供 了 一 
组 命令 ， 用 于 从 命令 行 上 访问 IPC 信息 以 及 清理 游离 的 IPC 机 制 。 它 们 
是 ipcs 和 ipcrm 命 令 ， 这 两 个 命令 对 于 开发 程序 非常 有 用 。 

IPC 机 制 一 个 让 人 烦恼 的 问题 是 ;编写 错误 的 程序 或 因为 某 些 原因 
而 执行 失败 的 程序 将 把 它 的 IPC 资 源 〈 如 消息 队列 中 的 数据 ) 遗留 在 系 
统 中 ， 并 且 这 些 资源 在 程序 结束 后 很 长 时 间 仍 然 在 系统 中 游荡 。 这 将 导 
致 对 程序 的 新 调用 执行 失败 ， 因 为 程序 期 望 以 一 个 干净 的 系统 来 启动， 
但 事实 上 却 发 现 一 些 遗 留 的 资源 。 状 态 命 令 (ipcs) 和 删除 命令 
(ipcrm) 提供 了 一 种 检查 和 清理 IPC 机 制 的 方法 。 


要 检查 系统 中 信和 号 量 的 状态 ， 可 以 使 用 命令 ipcs -S。 如 果 系 统 中 有 
信号 量 存 在 ， 就 会 给 出 如 下 格式 的 输出 : 
5 ./ipces -8 
senen= Semaphore Arrays -------- 
key semid owner perms nsems 
Ox4d00dfla 768 rick 666 1 


你 可 以 用 命令 ipcrm 来 删除 那些 因 意 外 情况 而 被 程序 遗留 在 系统 中 
的 信号 量 。 要 删除 上 面 的 信号 量 ， 使 用 的 命令 〈 在 Linux 系 统 中 ) 如 下 
所 示 : 
$ ./ipcrm -s 768 

一 些 非常 老 的 Linux 系 统 使 用 一 个 稍微 不 同 的 命令 语法 : 
$ ./ipcrm sem 768 

但 这 种 命令 语法 现在 已 很 少 使 用 。 请 查看 系统 手册 页 来 确定 在 你 的 
特定 系统 中 应 该 使 用 的 正确 语法 格式 。 
14.5.2 显示 共享 状态 


类 似 于 信号 量 ， 许 多 系统 提供 了 命令 行程 序 来 访问 共享 内 存 的 细节 
情况 。 它 们 是 命令 ipcs -m 和 ipcrm -m <id> (或 ipcrm shm <id>) 。 


下 面 是 一 些 ipcs -m 命 令 的 样本 输出 : 


$ ipcs -m 


~----- Shared Memory Segments -------- 
key shmid owner perms bytes nattch status 
0x00000000 384 rick 666 4096 2 


dest 


这 里 显示 的 是 一 个 长 度 为 4KB 的 共享 内 存 段 ， 它 被 两 个 进程 连接 。 


ipcrm -m t 享 内 存 。 如 果 程序 因 运 行 失败 而 
未 清理 共享 内 存 ， 这 个 命令 就 很 有 用 了 。 


14.5.3 WAN ERAS 


用 于 消息 队列 的 命令 是 ipcs -qfliperm -q <id> 


(或 ipcrm msg 
<id>) 。 
下 面 是 命令 ipcs -q 的 一 些 样本 输出 : 
5 ipcs -q 


Message Queues -------- 
key msqid owner 


perms used-bytes 
0x000004d2 3384 


ick 666 2048 


这 显示 了 两 个 消息 ， 在 消息 队列 中 的 总 长 度 为 2 048 个 字 节 。 
ipcrm -q <id> 命 令 用 于 删除 一 个 消息 队列 。 


me PO 


14.6 小结 


在 本 章 中 ， 我 们 介绍 了 3 种 进程 间 通 信 的 机 制 ， 它 们 最 早出 现在 
UNIX System V.2 版 本 中 ， 并 从 Linux 的 早期 版 本 开始 就 已 可 用 。 这 些 机 
制 是 信号 量 、 共 享 内 存 和 消息 队列 。 我 们 介绍 了 它们 所 提供 的 复杂 功能 
以 及 这 些 功 能 是 如 何 提供 的 。 一 旦 我 们 理解 了 这 些 功 能 ， 它 们 就 可 以 为 
许多 进程 间 通 信和 的 需求 提供 强 有 力 的 解决 方案 。 


Poke =r. > 
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在 本 章 中 ， 我 们 将 介绍 进程 间 通 信 的 另 一 种 方法 ， 与 我 们 在 第 
13、14 章 讨论 的 方法 相 比 ， 它 有 着 明显 的 不 同 。 到 目前 为 止 ， 我 们 讨论 
的 所 有 机 制 都 依靠 一 台 计 算 机 系统 的 共享 资源 实现 。 这 里 的 资源 可 以 是 
文件 系统 空间 、 共 享 的 物理 内 存 或 消息 队列 ， 但 只 有 运行 在 同一 台 机 器 
上 的 进程 才能 使 用 它们 。 

伯克利 版 本 的 UNIX 系 统 引 入 了 一 种 新 的 通信 工具 一 一 套 接 字 接 口 

(socket ”interface〉， 它 是 我 们 在 第 13 章 介绍 的 管道 概念 的 一 个 扩展 。 
Linux 系 统 文 持 套 接 字 接口 。 你 可 以 通过 与 使 用 管道 类 似 的 方法 来 使 用 
套 接 字 ， 但 套 接 字 还 包括 了 计算 机 网 络 中 的 通信 。 一 台 机 器 上 的 进程 可 
以 使 用 套 接 字 和 男 外 一 台 机 器 上 的 进程 通信 ， 这 样 束 可 以 支持 分 布 在 网 
eu aa 。 同 一 台 机 器 上 的 进程 之 间 也 可 以 使 用 套 接 字 
进行 通信 。 

此 外 ， 微 软 的 Windows 系 统 也 通过 可 公开 获取 的 Windows Sockets 技 
术 规 范 〈 人 简称 WinSock) 实现 了 套 接 字 接 口 。Windows 系 统 的 套 接 字 服 
务 是 由 系统 文件 Winsock.dll 来 提供 的 。 因 此 ，Windows 程 序 可 以 通过 网 
络 和 Linux/UNIX 计 算 机 进行 通信 来 实现 客户 /服务 器 系统 ， 反 之 亦 然 。 
虽然 winSock 的 编程 接口 和 UNIX 套 接 字 不 尽 相 同 ， 但 它 同样 是 以 套 接 
字 为 基础 的 。 

Linux 丰 富 的 网 络 功能 不 可 能 只 用 一 章 的 篇 幅 就 完全 涵盖 ， 所 以 我 
们 将 在 本 章 中 对 主要 的 网 络 编程 接口 进行 介绍 。 掌 握 了 本 章 的 内 容 后 ， 
你 惑 可 以 开始 编写 上 自己 的 网 络 程 序 了 。 我 们 将 主要 介绍 下 面 的 内 容 : 

口 、 套 接 字 连接 的 工作 原理 

口 、 套 接 字 的 属性 、 地 址 和 通信 

O ”网络 信 息 和 互联 网 守护 进程 (inetd/xinetd) 

O 客户 和 服务 器 


15.1 LEBT 


ERT (socket) 是 一 种 通信 机 制 ， 和 凭借 这 种 机 制 ， 铬 户 /服务 絮 系 
统 的 开发 工作 既 可 以 在 本 地 单机 上 进行 ， 也 可 以 路 网 络 进 行 。Linux 所 
提供 的 功能 《如 打印 服务 、 连 接 数据 库 和 提供 Web 页 面 ) 和 网 络 工 具 
(如 用 于 远程 登录 的 rlogin 和 用 于 文件 传输 的 ftp〉 通常 都 是 通过 套 接 字 
来 进行 通信 的 。 

套 接 字 的 创建 和 使 用 与 管道 是 有 区 别 的 ， 因 为 套 接 字 明确 地 将 客户 
和 服务 器 区 分 开 来 。 套 接 字 机 制 可 以 实现 将 多 个 客户 连接 到 一 个 服务 
AÑ o 


15.2 TER 


你 可 以 把 套 接 字 连接 想象 为 打 电 话 进 一 个 莹 忙 的 办 公 大 楼 。 一 个 电 
话 打 到 一 家 公司 ， 接 线 员 接听 电话 并 把 它 转 到 正确 的 部 门 〈《 服 务 器 进 
KE) ， 然 后 再 从 那里 转 到 电话 要 找 的 人 《服务 器 套 接 字 ) 。 每 个 进入 的 
电话 呼叫 “客户 ) 都 被 转 到 正确 的 终端 节点 ， 而 中 间 介 入 的 接线 员 则 可 
以 空 出 来 处 理 后 续 的 电话 。 在 开始 学 习 Linux 系 统 中 的 套 接 字 连 接 是 如 
何 建立 之 前 ， 我 们 需要 先 理解 套 接 字 应 用 程序 是 如 何 通过 套 接 字 来 维持 
一 个 连接 的 。 

首先 ， 服 务 器 应 用 程序 用 系统 调用 socket 来 创建 一 个 套 接 字 ， 它 是 
ASAD ACER AN Ae BRS ANAC AEP TH BOR, ESBS AEE 


INF o 

接 下 来 ， 服 务 器 进程 会 给 套 接 字 起 个 名 字 。 本 地 和 套 接 字 的 名 字 是 
Linux 文 件 系统 中 的 文件 名 ， 一 般 放 在 /tmp 或 /usr/tmp 目 录 中 。 对 于 网 络 
套 接 字 ， 它 的 名 字 是 与 客户 连接 的 特定 网 络 有 关 的 服务 标识 和 从 (端口 号 
或 访问 点 ) 。 这 个 标识 符 允 许 Linux 将 进入 的 针对 特定 端口 号 的 连接 转 
到 正确 的 服务 器 进程 。 例 如 ，Web 服 务 器 一 般 在 80 端 口上 创建 一 个 套 接 
字 ， 这 是 一 个 专用 于 此 目的 的 标识 符 。Web 浏 览 器 知道 对 于 用 户 想 要 访 
问 的 web 站 点 ， 应 该 使 用 端口 80 来 建立 HTTP 连 接 。 我 们 用 系统 调用 bind 
来 给 套 接 字 命 名 。 然 后 服务 器 进程 就 开始 等 待 客 户 连 接 到 这 个 命名 套 接 
字 。 系 统 调用 listen 的 作用 是 ， 创 建 一 个 队列 并 将 其 用 于 存放 来 自 客户 的 
进入 连接 。 服 务 器 通过 系统 调用 accept 来 接受 客户 的 连接 。 

服务 器 调用 accept 时 ， 它 会 创建 一 个 与 原 有 的 命名 套 接 字 不 同 的 新 
套 接 字 。 这 个 新 套 接 字 只 用 于 与 这 个 特定 的 客户 进行 通信 ， 而 命名 套 接 
字 则 被 保留 下 来 继续 处 理 来 自 其 他 客户 的 连接 。 如 果 服 务 器 编写 得 当 ， 
它 就 可 以 充分 利用 多 个 连接 带 来 的 好 处 。Web 服 务 器 天 会 这 么 做 以 同时 
服务 来 自 许多 客户 的 页 面 请 求 。 对 一 个 简单 的 服务 器 来 说 ， 后 续 的 客户 
将 在 监听 队列 中 等 待 ， 直 到 服务 器 再 次 准备 就 绪 。 

基于 套 接 字 系统 的 客户 问 更 加 简单。 客户 首先 调用 socket 创 建 一 个 
未 命名 套 接 字 ， 然 后 将 服务 器 的 命名 套 接 字 作 为 一 个 地 址 来 调用 connect 
与 服务 器 建立 连接 。 

一 旦 连接 建立 ， 我 们 就 可 以 像 使 用 底层 的 文件 描述 符 那 样 用 套 接 字 
来 实现 双 回 的 数据 通信 。 


实 验 一 个 简单 的 本 地 客户 
下 面 是 一 个 非常 简单 的 套 接 字 客户 程序 的 例子 dient1l.c。 它 创建 一 


个 未 命名 的 套 接 字 ， 然 后 把 它 连接 到 服务 器 套 接 字 server_socket。 关 于 
lel 统 调 用 的 细节 ， 我 们 将 在 讨论 完 与 地 址 相关 的 一 些 问 题 之 后 再 


来 介 
ee 


(2) 为 客户 创建 一 个 套 接 字 : 
sockfd = socket (AF_UNIX, SOCK_STREAM, 0); 
ce 根据 服务 器 的 情况 给 套 接 字 命名 


ess.sun_family = AF_UNIX 


a) RUNER S eno 


(5) 现在 就 可 以 通过 sockfd 进 行 读 写 操作 了 : 
write(sockfd, &ch, 1); 
read(sockfd, &ch, 1); 
printf("char from server = %c\n", ch); 
close (sock£d) ; 
exit(0); 
} 
运行 这 个 程序 时 ， 它 会 失败 ， 因 为 你 还 没有 创建 服务 器 端的 命名 套 
接 字 (具体 的 错误 信息 将 随 系 统 的 不 同 而 不 同 〉。 
$ ./clientl 
oops: clientl: No such file or directory 
$ 


X 验 一 个 简单 的 本 地 服务 器 
下 面 是 一 个 非常 简单 的 服务 器 程序 server1.c， 它 接受 来 自 客 户 程序 
的 连接 。 它 首先 创建 一 个 服务 器 套 接 字 ， 将 它 绑 定 到 一 个 名 字 ， 然 后 创 
ees 开始 接受 客户 的 连接 。 “(1) 包含 必要 的 头 文件 并 设 
量 : 


‘ | ẹ <sys/types.h> 
socket 


D DLT KRARUP- TRMA BF 


server SOCK STREAM. 0): 
O GERI 


(D abit 4 接 队列 ， 开始 等待 客户 进行 连接 


O) 接受 一 个 过 车 接 ， 


(6) ic client tsockfd 套 接 字 上 的 客户 了 恋 写 操作 : 


实验 解析 
这 个 例子 中 的 服务 器 程序 一 次 只 能 为 一 个 客户 服务 。 它 从 客户 那里 
读 取 一 个 字符 ， 增 加 筷 的 值 ， 然 后 再 把 它 写 回 去 。 在 更 加 复杂 的 系统 


中 ， 服 务 亏 需要 为 每 个 客户 执行 更 多 的 处 理工 作 ， 这 种 一 次 只 为 一 个 客 
户 服务 的 做 法 就 变 得 不 可 接受 了 ， 因 为 其 他 客户 只 有 等 到 服务 器 结束 上 
一 个 客户 的 处 理 任 务 后 才能 处 理 它 的 连接 。 我 们 将 在 后 面 看 到 几 个 允许 
同时 处 理 多 个 连接 的 解决 方案 。 


运行 服务 喜 程 序 时 ， 它 创建 一 个 套 接 字 并 开始 等 待 客 尸 的 连接 。 如 
果 你 在 后 台 局 动 它 ， 让 它 独立 地 运行 ， 束 可 以 在 前 台 局 动 客 户 程 序 。 如 
BATA: 


S ./serverl & 
[1] 1094 


$ server waiting 
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到 它 。 
记 住 : 用 完 一 个 套 接 字 后 ， 就 应 该 把 它 删 除 掉 ， 即 使 是 在 程序 因 接 
收 到 一 个 信号 而 异常 终止 的 情况 下 也 应 该 这 么 做 。 这 可 以 避免 文件 系统 
应 充斥 着 无 用 的 文件 而 变 得 混乱 。 


> ls -1F server_socket 


访问 权限 前 面 的 字母 s 和 这 一 行 末尾 的 等 号 = 表示 该 设备 的 类 型 
是 “ 套 接 字 ”。 套 接 字 的 创建 过 程 与 普通 文件 一 样 ， 它 的 访问 权限 会 被 当 
前 的 掩 码 值 所 修改 。 如 果 使 用 ps 命令 ， 你 可 以 看 到 服务 器 正 运 行 在 后 
台 。 它 目前 处 于 休眠 状态 〈STAT 栏 显示 的 是 S) ， 因 此 它 没有 消耗 CPU 
资源 。 如 下 所 示 : 


$ ps lx 


现在 运行 客户 程序 ， 你 就 可 以 成 功 地 连接 到 服务 器 了 。 因 为 服务 器 
套 接 字 已 经 存在 ， 所 以 你 可 以 连接 到 它 并 与 服务 右 进 行 通信 。 如 下 所 
ZN: 
$ ./client1 
server waiting 
char from server = B 


$ 


服务 器 的 输出 和 客户 的 输出 在 我 们 的 终端 上 混在 了 一 起 ， 但 还 是 可 
以 看 出 服务 器 从 客户 那里 接收 了 一 个 字符 ， 将 它 的 值 增加 ， 然 后 再 返回 
它 。 接 着 服务 器 继续 运行 并 等 待 下 一 个 客户 的 到 来 。 如 果 同 时 运行 多 个 
客户 ， 它 们 将 被 依次 服务 ， 但 你 看 到 的 输出 结果 可 能 会 更 加 混乱 。 如 下 


所 示 : 

./client1 & ./clientl & ./clientl & 
2] 23412 

3] 23413 

4] 23414 

ver waiting 

har from server = B 
server waiting 


> O 
w ht 


Char from server = B 
server waiting 
char from server = B 


server waiting 


[2] Done clientl 
[3] Done clienti 
[4]+ Done clientl 
é 

15.2.1 字 属 性 


要 想 完 全 理解 在 上 面 例子 中 所 使 用 的 系统 调用 ， 你 需要 先 学 习 一 些 
UNIX 网 络 方面 的 知识 。 

套 接 字 的 特性 由 3 个 属性 确定 ， 它 们 是 : 域 (domain) 、 类 型 
(type) 和 协议 Cprotocol) 。 套 接 字 还 用 地 址 作为 它 的 名 字 。 地 址 的 格 
式 随 域 〈 又 被 称 为 协议 族 ，protocol family) 的 不 同 而 不 同 。 每 个 协议 族 
又 可 以 使 用 一 个 或 多 个 地 址 族 来 定义 地 址 格式 。 

1. BTE 

域 指 定 套 接 字 通信 中 使 用 的 网 络 介 质 。 最 常见 的 套 接 字 域 是 
AF_INET， 它 指 的 是 Internet 网 络 ， 许 多 Linux 局 域 网 使 用 的 都 是 该 网 
络 ， 当 然 ， 因 特 网 自身 用 的 也 是 它 。 其 底层 的 协议 一 一 网 际 协 议 GP) 
只 有 一 个 地 址 族 ， 它 使 用 一 种 特定 的 方式 来 指定 网 络 中 的 计算 机 ， 即 人 
们 和 常 说 的 地址。 


“下 一 代 ” 互 联网 协议 Ipv6 被 设计 用 于 克服 标准 IP 带 来 的 一 些 问 
题 ， 特 别 是 可 用 地 址 数量 有 限 的 问题 。IPv6 使 用 一 个 不 同 的 套 接 字 
域 AF_INET6 和 一 个 不 同 的 地 址 格式 。 人 们 期 望 它 能 最 终 蔡 换 IP， 
但 这 一 过 程 将 需要 经 过 许多 年 。 虽 然 Linux 也 支持 Ipv6 实 现 ， 但 这 
超出 了 本 书 介绍 的 范围 。 


虽然 我 们 几乎 总 是 用 域名 来 指定 因特网 上 的 联网 机 器 ， 但 它们 都 会 


被 转换 为 底层 的 IP 地 址 。 例 如 192.168.1.99 就 是 一 个 IP 地 址 。 所 有 的 IP 地 
址 都 用 4 个 数字 来 表示 ， 每 个 数字 都 小 于 256， 即 所 谓 的 点 分 四 元 组 表示 
法 (dotted quad) 。 当 客户 使 用 套 接 字 进行 跨 网 络 的 连接 时 ， 它 就 需要 
用 到 服务 器 计算 机 的 IP 地 址 。 

服务 器 计算 机 上 可 能 同时 有 多 个 服务 正在 运行 。 客 户 可 以 通过 IP 端 
口 来 指定 一 台 联 网 机 器 上 的 某 个 特定 服务 。 在 系统 内 部 ， 端 口 通过 分 配 
一 个 唯一 的 16 位 的 整数 来 标识 ， 在 系统 外 部 ， 则 需要 通过 IP 地 址 和 端口 


服务 器 在 特定 的 端口 等 待 客 户 的 连接 。 知 名 服务 所 分 配 的 端口 号 在 
所 有 Linux 和 UNIX 机 器 上 都 是 一 样 的 。 它 们 通常 〈 但 并 不 总 是 如 此 ) 小 
于 1024， 比 如 打印 机 缓冲 队列 进程 (515) ~ rlogin (513) 、ftp (21) 
和 httpd (80) 等 。 其 中 最 后 一 个 就 是 Web 服 务 器 的 标准 端口 。 一 般 情况 
下 ， 小 于 1024 的 端口 号 都 是 为 系统 服务 保留 的 ， 并 且 所 服务 的 进程 必须 
有 具有 超级 用 户 权 限 。X/Open 规 范 在 头 文 件 netdb.h 中 定义 了 一 个 常量 
IPPORT_RESERVED， 它 代表 保留 端口 号 的 最 大 值 。 

因为 标准 服务 都 对 应 标准 的 端口 号 ， 所 以 计算 机 之 间 可 以 轻松 地 互 
和 
端口 

第 一 个 例子 中 的 域 是 UNIX 文 件 系 统 域 AF_UNIX， 即 使 是 一 台 还 未 
联网 的 计算 机 上 的 套 接 字 也 可 以 使 用 这 个 域 。 这 个 域 的 底层 协议 就 是 文 
件 输入 /输出 ， 而 它 的 地 址 就 是 文件 名 。 我 们 的 服务 器 套 接 字 的 地 址 是 
当 我 们 运行 服务 器 程序 时 ， 就 可 以 在 当前 目录 下 看 到 这 
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其 他 可 以 使 用 的 域 还 包括 : 基于 ISO 标准 协议 的 网 络 所 使 用 的 
AF ISO 域 和 用 于 施乐 (Xerox) 网 络 系统 的 AF_XNS 域 。 它 们 都 不 在 本 
章 的 讨论 范围 之 内 。 

2. 套 接 字 类 型 

一 个 套 接 字 域 可 能 有 多 种 不 同 的 通信 方式 ， 而 每 种 通信 方式 又 有 其 
不 同 的 特性 。 但 AF_UNIX 域 的 套 接 字 没有 这 样 的 问题 ， 它 们 提供 了 一 
个 可 靠 的 双向 通信 路 径 。 在 网 络 域 中 ， 我 们 就 需要 注意 底层 网 络 的 特 
性 ， 以 及 不 同 的 通信 机 制 是 如 何 受 到 它们 的 影响 的 。 

因特网 协议 提供 了 两 种 通信 机 制 : 流 (stream) 和 数据 报 
(datagram) 。 它 们 有 着 截然 不 同 的 服务 层次 。 

MERT 

流 套 接 字 〈 在 某 些 方面 类 似 于 标准 的 输入 /输出 流 ) 提供 的 是 一 个 
有 序 、 可 靠 、 双 向 字 节 流 的 连接 。 因 此 ， 发 送 的 数据 可 以 确保 不 会 丢 


失 、 复 制 或 乱 序 到 达 ， 并 且 在 这 一 过 程 中 发 生 的 错误 也 不 会 显示 出 来 。 
大 的 消息 将 被 分 片 、 传 输 、 再 重组 。 这 很 像 一 个 文件 流 ， 它 接收 大 量 的 
数据 ， 然 后 以 小 数据 块 的 形式 将 它们 写 入 底层 磁盘 。 流 套 接 字 的 行为 是 
可 预见 的 。 

流 套 接 字 由 类 型 SOCK_STREAM 指 定 ， 它 们 是 在 AF_INET 域 中 通 
过 TCP/IP 连 接 实现 的 。 它 们 也 是 AF_UNIX 域 中 常用 的 套 接 字 类 型 。 在 
本 章 中 ， 我 们 将 重点 学 习 SOCK_STREAM 套 接 字 ， 因 为 它们 在 编写 网 
络 程序 时 是 最 常用 的 。 


TCP/IP 代 表 的 是 传输 控制 协议 (Transmission Control 
Protocol) /网 际 协议 (Internet Protocol) 。 了 IP 协 议 是 针对 数据 包 的 
底层 协议 ， 它 提供 从 一 台 计 算 机 通过 网 络 到 达 男 一 台 计 算 机 的 路 
由 。TCP 协 议 提供 排序 、 流 控 和 重 传 ， 以 确保 大 数据 的 传输 可 以 完 
整地 到 达 目 的 地 或 报告 一 个 适当 的 错误 条 件 。 


“数据 报 套 接 字 

与 流 套 接 字 相反 ， 由 类 型 SOCK_DGRAM 指 定 的 数据 报 套 接 字 不 建 
立 和 维持 一 个 连接 。 它 对 可 以 发 送 的 数据 报 的 长 度 有 限制 。 数 据 报 作为 
一 个 单独 的 网 络 消息 被 传输 ， 它 可 能 会 丢失 、 复 制 或 乱 序 到 达 。 

数据 报 套 接 字 是 在 AF_INET 域 中 通过 UDP/IP 连 接 实现 的 ， 它 提供 
的 是 一 种 无 序 的 不 可 靠 服 务 ”(UDP 代 表 的 是 用 户 数据 报 协 议 ) 。 但 从 
资源 的 角度 来 看 ， 相 对 来 说 它们 开销 比较 小 ， 因 为 不 需要 维持 网 络 连 
接 。 而 且 因为 无 需 花费 时 间 来 建立 连接 ， 所 以 它们 的 速度 也 很 快 。 

数据 报 适用 于 信息 服务 中 的 “ 单 次 ” (single-shot) 查询 ， 它 主要 用 
来 提供 日 常 状态 信息 或 执行 低 优先 级 的 日 志 记 录 。 它 的 优点 是 服务 器 的 
骨 溃 不 会 给 客户 造成 不 便 ， 也 不 会 要 求 客户 重启 ， 因 为 基于 数据 报 的 服 
a a 

现在 ， 我 们 和 暂时 离开 对 数据 报 的 讨论 ， 关 于 数据 报 的 更 多 信息 请 阅 
读本 章 最 后 一 节 。 

3. 套 接 字 协议 

只 要 底层 的 传输 机 制 允 许 不 止 一 个 协议 来 提供 要 求 的 套 接 字 类 型 ， 
我 们 就 可 以 为 套 接 字 选择 一 个 特定 的 协议 。 在 本 章 中 ， 我 们 将 重点 讨论 
UNIX 网 络 套 接 字 和 文件 系统 套 接 字 ， 它 们 不 需要 你 选择 一 个 特定 的 协 
议 ， 只 需要 使 用 其 默认 值 即 可 。 


15.2.2 ”创建 £ 


socket 系 统 调用 创建 一 个 套 接 字 并 返回 一 个 摘 述 符 ， 该 描述 符 可 以 
用 来 访问 该 套 接 字 。 
#include <sys/types.h> 
#include <sys/socket.h> 


int socket(int domain, int type, int protocol); 


创建 的 套 接 字 是 一 条 通信 线路 的 一 个 并 点。domain 参 数 指定 协议 
族 ，type 参 数 指定 这 个 套 接 字 的 通信 类 型 ，protocol 参 数 指定 使 用 的 协 
议 


domain 参 数 可 以 指定 的 协议 族 如 表 15-1 所 示 。 
表 15-1 


最 常用 的 套 接 字 域 是 AF_UNIX 和 AF_INET， 前 者 用 于 通过 UNIX 和 
Linux 文 件 系统 实现 的 本 地 套 接 字 ， 后 者 用 于 UNIX 网 络 套 接 字 。 
AF_INET 套 接 字 可 以 用 于 通过 包括 因特网 在 内 的 TCP/P 网 络 进行 通信 的 


socket 函数 的 参数 type 指 定 用 于 新 套 接 字 的 通信 特性 。 它 的 取 值 包 
括 SOCK_STREAM 和 SOCK_DGRAM. 

SOCK_STREAM 是 一 个 有 序 、 可 靠 、 面 向 连 接 的 双 辐 字 节 流 。 对 
AF_INET 域 套 接 字 来 说 ， 它 默认 是 通过 一 个 TCP 连 接 来 提供 这 一 特性 
的 ，TCP 连 接 在 两 个 流 套 接 字 端点 之 间 建 立 。 数 据 可 以 通过 套 接 字 连接 
进行 双 癌 传递 。TCP 协 议 所 提供 的 机 制 可 以 用 于 分 片 和 重组 长 消息 ， 并 
且 可 以 重 传 可 能 在 网 络 中 丢失 的 数据 。 

SOCK_DGRAM 是 数据 报 服务 。 我 们 可 以 用 它 来 发 送 最 大 长 度 固定 
(通常 比较 小 ) 的 消息 ， 但 消息 是 人 否 会 被 正确 传递 或 消息 是 否 不 会 乱 序 
到 达 并 没有 保证 。 对 于 AF_INET 域 套 接 字 来 说 ， 这 种 类 型 的 通信 是 由 
UDP 数据 报 来 提供 的 。 

通信 所 用 的 协议 一 般 由 套 接 字 类 型 和 套 接 字 域 来 决定 ， 通 常 不 需要 
选择 。 只 有 当 需 要 选择 时 ， 我 们 才 会 用 到 protocol 参 数 。 将 该 参数 设置 
为 0 表示 使 用 默认 协议 ， 我 们 将 在 本 章 的 所 有 例子 中 都 这 样 做 。 
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件 描述 符 。 当 这 个 套 接 字 连接 到 另 一 端的 套 接 字 后 ， 我 们 就 可 以 用 read 
和 write 系统 调用 ， 通 过 这 个 描述 符 来 在 套 接 字 上 发 送 和 接收 数据 了 。 
close 系 统 调 用 用 于 结束 套 接 字 连 接 。 


15.2.3 Tht 


每 个 套 接 字 域 都 有 其 自己 的 地 址 格式 。 对 于 AF_UNIX 域 套 接 字 来 
i ， 它 的 地 址 由 结构 sockaddr_un 来 描述 ， 该 结构 定义 在 头 文件 sys/un.h 


struct sockaddr_un { 
sa_family t sun_family; /* AF _ UNIX */ 
char sun_path[]; /* pathname */ 


因此 ， 对 套 接 字 进 行 处 理 的 系统 调用 可 能 需要 接受 不 同类 型 的 地 
址 ， 每 种 地 址 格式 都 使 用 一 种 类 似 的 结构 来 描述 ， 它 们 都 以 一 个 指定 地 
址 类 型 〈 套 接 字 域 ) 的 成 员 〈 在 本 例 中 是 sun_family) 开始 。 在 
AF_UNIX 域 中 ， 套 接 字 地 址 由 结构 中 的 sun_path 成 员 中 的 文件 名 所 指 
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在 当前 的 Linux 系 统 中 ， 由 X/Open 规 范 定 义 的 类 型 sa_family_t 在 头 
文件 sys/un.h 中 声明 ， 它 是 短 整 数 类 型 。 此 外 ，sun_path 指 定 的 路 径 名 长 
度 也 是 有 限制 的 〈Linux 规 定 的 是 108 个 字符 ， 其 他 系统 可 能 使 用 的 是 更 
清楚 的 常量 ， 如 UNIX_MAX_PATH) 。 因 为 地 址 结构 的 长 度 不 一 致 ， 
所 以 许多 套 接 字 调 用 需要 用 到 一 个 用 来 复制 特定 地 址 结构 的 长 度 变量 或 
将 它 作为 一 个 输出 。 

在 AF_INET 域 中 ， 套 接 字 地 址 由 结构 sockaddr_in 来 指定 ， 该 结构 定 
义 在 头 文件 netineUin.h 中 ， 它 至 少 包 含 以 下 几 个 成 员 : 

h iá sin_family; /* AF_INET */ 


unsigned short int sin_port; /* Port number */ 
struct in addr sin_addr; /* Internet address */ 


} 


‘3 
IP 地 址 结构 in_addr 被 定义 为 : 
struct in addr { 
unsigned long int s_addr; 
}; 
IP 地 址 中 的 4 个 字 节 组 成 一 个 32 位 的 值 。 一 个 AF_INET 套 接 字 由 它 


的 域 、 卫 地址 和 端口 号 来 完全 确定 。 从 应 用 程序 的 角度 来 看 ， 所 有 套 接 
字 的 行为 就 像 文件 描述 符 一 样 ， 并 且 通 过 一 个 唯一 的 整数 值 来 区 分 。 


15.2.4 fn Z 


要 想 让 通过 socket 调 用 创建 的 套 接 字 可 以 被 其 他 进程 使 用 ， 服 务 器 
程序 就 必须 给 该 套 接 字 命名 。 这 样 ，AF_UNIX 套 接 字 就 会 关联 到 一 个 
文件 系统 的 路 径 名 ， 正 如 你 在 server1 例 子 中 所 看 到 的 。AF_INET 套 接 字 
就 会 关联 到 一 个 卫 端 口号 。 


#include <sys/socket.h> 


int bind(int socket, const struct sockaddr *address, size_t address_len); 


bind 系 统 调用 把 参数 address 中 的 地 址 分 配给 与 文件 描述 符 socket 关 
联 的 未 命名 套 接 字 。 地 址 结构 的 长 度 由 参数 address_len 传 递 。 
地 址 的 长 度 和 格式 取决 于 地 址 族 。bind 调 用 需要 将 一 个 特定 的 地 址 
结构 指针 转换 为 指向 通用 地 址 类 型 (struct sockaddr *) 。 
网 aiid 在 成 功 时 返回 0， 失 败 时 返回 -1 并 设置 errno 为 表 15-2 中 的 一 
ME 


表 15-2 


errno 值 说 阴 


符 对 应 的 不 是 一 个 奢 接 ? 
CRA PO AHIR 
地 址 As af H 
地 


AF_UNIX 域 套 接 字 还 有 其 他 一 些 错误 代码 ， 如 表 15-3 所 示 。 


表 15-3 


15.2.5 ”创建 ZAAI 


为 了 能 够 在 套 接 字 上 接受 进入 的 连接 ， 服 务 喜 程 序 必 须 创 建 一 个 队 
列 来 保存 未 处 理 的 请 求 。 它 用 listen 系 统 调用 来 完成 这 一 工作 。 


#include <sys/socket.h> 


int listen(int socket, int backlog); 


Linux 系 统 可 能 会 对 队列 中 可 以 容纳 的 未 处 理 连 接 的 最 大 数目 做 出 
限制 。 为 了 遵守 这 个 最 大 值 限 制 ，listen 函 数 将 队列 长 度 设置 为 backlog 
参数 的 值 。 在 套 接 字 队列 中 ， 等 待 处 理 的 进入 连接 的 个 数 最 多 不 能 超过 
这 个 数字 。 再 往 后 的 连接 将 被 拒绝 ， 导 致 客户 的 连接 请 求 失 败 。listen 函 
数 提供 的 这 种 机 制 允 许 当 服务 器 程序 正 忙于 处 理 前 一 个 客户 请 求 的 时 
候 ， 将 后 续 的 客户 连接 放 入 队列 等 待 处 理 。backlog 参 数 常 用 的 值 是 5。 

listen 函 数 在 成 功 时 返回 0， 失 败 时 返回 -1。 错 误 代 码 包括 EBADE、 
EINVAL 和 ENOTSOCK， 其 含义 与 上 面 bind 系 统 调 用 中 说 明 的 一 样 。 


15.2.6 apes 


一 旦 服务 器 程序 创建 并 命名 了 套 接 字 之 后 ， 它 束 可 以 通过 accept 系 
统 调用 来 等 待 客户 建立 对 该 套 接 字 的 连接 。 


#include <sys/socket.h> 


int accept(int socket, struct sockaddr *address, size_t *address_len); 


accept 系 统 调用 只 有 当 有 客户 程序 试图 连接 到 由 socket 参 数 指定 的 套 
接 字 上 时 才 返 回 。 这 里 的 客户 是 指 ， 在 套 接 字 队列 中 排 在 第 一 个 的 未 处 
理 连接 。accept 函 数 将 创建 一 个 新 套 接 字 来 与 该 客户 进行 通信 ， 并 且 返 


套 接 字 必须 事先 由 bind 调 用 命名 ， 并 且 由 listen 调 用 给 它 分 配 一 个 连 
接 队 列 。 连 接客 户 的 地 址 将 被 放 入 address 参 数 指向 的 sockaddr 结 构 中 。 
如 果 我 们 不 关心 客户 的 地 址 ， 也 可 以 将 address 参 数 指 定 为 空 指 针 。 

参数 address_len 指 定 客 户 结构 的 长 度 。 如 果 客 户 地 址 的 长 度 超 过 这 
个 值 ， 它 将 被 截断 。 所 以 在 调用 accept 之 前 ，address_len 必 须 被 设置 为 
预期 的 地 址 长 度 。 当 这 个 调用 返回 时 ，address_len 将 被 设置 为 连接 客户 
地 址 结构 的 实际 长 度 。 

如 果 套 接 字 队列 中 没有 未 处 理 的 连接 ，accept 将 阻塞 〈 程 序 将 暂 
停 ) 直到 有 客户 建立 连接 为 止 。 我 们 可 以 通过 对 套 接 字 文 件 描 述 符 设置 
O_NONBLOCK 标 志 来 改变 这 一 行为 ， 使 用 的 函数 是 fcnt1， 如 下 所 示 : 

int flags = fcntl(socket, F GETFL, 0); 


fcntl(socket, F_SETFL, O_NONBLOCK |flags); 


当 有 未 处 理 的 客户 连接 时 ，accept 函 数 将 返回 一 个 新 的 套 接 字 文件 
描述 符 。 发 生 错 误 时 ，accept 函 数 将 返回 -1。 可 能 的 错误 情况 大 部 分 与 
bind、listen 调 用 类 似 ， 其 他 的 错误 有 EWOULDBLOCK 和 EINTR。 前 者 
是 当 指 定 了 O_NONBLOCK 标 志 ， 但 队列 中 没有 未 处 理 连接 时 产生 的 错 
误 。 后 者 是 当 进 程 阻塞 在 accept 调 用 时 ， 执 行 被 中 断 而 产生 的 错误 。 


15.2.7 WOKE 
客户 程序 通过 在 一 个 未 命名 套 接 字 和 服务 器 监听 套 接 字 之 间 建 立 连 
接 的 方法 来 连接 到 服务 器 。 它 们 通过 connect 调 用 来 完成 这 一 工作 。 


#include <sys/socket.h> 


int connect (int socket, const struct sockaddr *address, size_t address_len); 


参数 socket 指定 的 套 接 字 将 连接 到 参数 address 指 定 的 服务 器 套 接 
字 ，address 指 向 的 结构 的 长 度 由 参数 address_len 指 定 。 参 数 socket 指 定 
的 套 接 字 必须 是 通过 socket 调 用 获得 的 一 个 有 效 的 文件 描述 符 。 

成 功 时 ，connect 调 用 返回 0， 失 败 时 返回 -1。 可 能 的 错误 代码 见 表 
15-4。 


表 15-4 


LE 接 超时 


FARE 


如 果 连 接 不 能 立刻 建立 ，connect 调 用 将 阻塞 一 段 不 确定 的 超时 时 
间 。 一 旦 这 个 超时 时 间 到 达 ， 连 接 将 被 放弃 ，connect 调 用 失败 。 但 如 果 
connect 调 用 被 一 个 信号 中 断 ， 而 该 信号 又 得 到 了 处 理 ，connect 调 用 还 
是 会 失败 (ermo 被 设置 为 EINTR)〉， 但 连接 尝试 并 不 会 被 放弃 ， 而 是 以 
异步 方式 继续 建立 ， 程 序 必须 在 此 后 进行 检查 以 查看 连接 是 否 成 功 建 
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与 accept 调 用 一 样 ，connect 调 用 的 阻塞 特性 可 以 通过 设置 该 文件 摘 
述 符 的 O NONBLOCK 标 志 来 改变 。 此 时 ， 如 果 连 接 不 能 立刻 建立 ， 
connect 将 失败 并 把 errno 设 置 为 EINPROGRESS， 而 连接 将 以 异步 方式 继 
续 进 行 。 

虽然 异步 连接 难于 处 理 ， 但 我 们 可 以 在 套 接 字 文件 描述 符 上 ， 用 
select 调 用 来 检查 套 接 字 是 耕 已 处 于 写 就 绪 状 态 。 我 们 将 在 本 章 的 后 面 
介绍 select 调 用 。 


15.2.8 KH T 


你 可 以 通过 调用 close 函 数 来 终止 服务 器 和 客户 上 的 套 接 字 连接 ， 就 
如 同 对 底层 文件 描述 符 进行 关闭 一 样 。 你 应 该 总 是 在 连接 的 两 端 都 关闭 
套 接 字 。 对 于 服务 器 来 说 ， 应 该 在 read 调 用 返回 0 时 关闭 套 接 字 ， 但 如 
果 套 接 字 是 一 个 面 癌 连接 类 型 的 ， 并 且 设 置 了 SOCK_LINGER 选 项 ， 
close 调 用 会 在 该 套 接 字 还 有 未 传输 数据 时 阻塞 。 你 将 在 本 章 后 面 的 内 容 
中 学 习 到 如 何 设置 套 接 字 选项 。 


15.2.9 字 通 信 


在 介绍 完 与 套 接 字 相关 的 基本 系统 调用 后 ， 我 们 来 看 几 个 示例 程 
序 。 我 们 将 尽量 使 用 网 络 套 接 字 而 不 是 文件 系统 套 接 字 。 文 件 系统 套 接 
字 的 缺点 是 ， 除 非 程序 员 使 用 一 个 绝对 路 径 名 ， 否 则 套 接 字 将 创建 在 服 
务 器 程序 的 当前 目录 下 。 为 了 让 它 更 具 通 用 型 ， 你 需要 将 它 创 建 在 一 个 
服务 器 及 其 客户 都 认可 的 可 全 局 访问 的 目录 〈 如 /mp 目录 ) 中 。 而 对 网 
络 套 接 字 来 说 ， 你 只 需要 选择 一 个 未 被 使 用 的 端口 号 即 可 。 

我 们 的 例子 将 选择 端口 号 9734， 这 个 端口 号 是 在 避 开 标准 服务 的 前 
提 下 随意 选择 的 《我 们 不 能 使 用 小 于 1024 的 端口 号 ， 因 为 它们 都 是 为 系 
统 使 用 保留 的 ) 。 其 他 端口 号 及 通过 它们 提供 的 服务 通 篆 都 列 在 系统 文 
件 /etc/services 中 。 编 写 基 于 套 接 字 的 应 用 程序 时 ， 请 注意 总 要 选择 没有 
列 在 该 配置 文件 中 的 端口 号 。 


请 注意 在 程序 client2.c 和 server2.c 中 有 个 我 们 故意 设置 的 错 
误 ， 我 们 将 在 client3.c 和 server3.c 中 修复 这 个 错误 。 所 以 请 不 要 将 
client2.c 和 server2.c 中 的 代码 用 到 你 上 自己 的 程序 中 。 


我 们 将 在 局 域 网 中 运行 我 们 的 客户 和 服务 右 ， 但 网 络 套 接 字 不 仅 可 
用 于 局 域 网 ， 任 何 带 有 因特网 连接 〈 即 使 是 一 个 调制 解 调 器 拨号 连接 ) 
的 机 器 都 可 以 使 用 网 络 套 接 字 来 彼此 通信 。 甚 至 可 以 在 一 台 UNIX 单 机 
上 运行 基于 网 络 的 程序 ， 因 为 UNIX 计 算 机 通常 会 配置 了 一 个 只 包含 它 
自身 的 回路 Coopback) 网 络 。 出 于 演示 的 目的 ， 我 们 将 使 用 这 个 回路 
网 络 。 回 路 网 络 对 调试 网 络 应 用 程序 也 很 有 用 ， 因 为 它 排 除了 任何 外 部 
网 络 问 题 。 

回路 网 络 中 只 包含 一 台 计 算 机 ， 传 统 上 它 被 称 为 localhost， 它 有 一 
个 标准 的 PP 地址 127.0.0.1。 这 束 是 本 地 主机 。 你 可 以 在 网 络 主机 文 
件 /etc/hosts 中 找到 它 的 地 址 ， 在 该 文件 中 还 列 出 了 在 共享 网 络 中 的 其 他 


主机 的 名 字 和 对 应 的 地 址 。 

每 个 与 计算 机 进行 通信 的 网 络 都 有 一 个 与 之 关联 的 人 硬件 接口 。 一 
计算 机 可 能 在 每 个 网 络 中 都 有 一 个 不 同 的 网 络 名 ， 当 然 也 就 会 有 几 个 不 
同 的 卫 地 址 。 例 如 ，Neil 的 机 器 tilde 就 有 3 个 网 络 接口 ， 因 此 也 就 有 3 个 
Rs EP OTE REED 如 下 所 不: 


168.1 tilde. localnet - a private Ethernet 


KEN 简单 的 回路 网 络 ， 第 二 个 是 通过 一 块 以 太 网 卡 来 访问 的 
局 域 网 ， 是 到 一 个 因特网 接 入 服务 提供 商 的 调制 解 调 器 连接 。 你 


绩 写 的 各 到 按 字 的 网 络 程序 ， 可 以 不 息 任 倍 修改 就 能 通过 住人， 个 网 
络 接口 与 服务 器 进行 通信 。 


X 验 网 络 客户 

下 面 是 一 个 修改 过 的 客户 程序 client2.c， 它 通过 回路 网 络 连 接 到 一 
个 网 络 套 接 字 。 这 个 程序 有 一 个 与 硬件 相关 的 细微 错误 ， 我 们 将 在 本 章 
的 后 面 再 讨论 它 。 

D ae ee 


nelide <eve/twm 
# ine uade <: ys Yt es 


#include <sys/socket.h> 
#include <stdio.h> 
#include <netinet/in.h> 
#include <arpa/inet.h> 
#include <unistd.h> 


iiid oF WA © be 
#include <stdlib.h> 
int main() 
“> “Amb FA 。 
Lil SOUC CALU; 
struct sockaddr_in address; 
int result; 


char ch 一 


int. 
— “a g 


(2) 为 客户 创建 一 个 套 接 字 : 
sockfd = socket (AF_INET, SOCK_STREAM, 0) ; 
(3) 命名 套 接 字 ， 与 服务 器 保持 一 致 : 
eevee See = AF_INET; 
address.sin_addr.s_addr = inet_addr("127.0.0.1") 
address.sin_port = 9734; 
len = sizeof(address) ; 


这 个 程序 的 剩余 部 分 与 本 章 前 面 的 client1.c 完 全 一 样 。 运 行 这 个 版 
本 的 客户 程序 时 ， 它 将 连接 失败 ， 因 为 还 没有 服务 器 运行 在 这 台 计 算 机 
的 9734 端 口上 。 
$ ./client2 
oops: client2: Connection refused 
$ 
实验 解析 
客户 程序 用 在 头 文 件 netineUin.h 中 定义 的 sockaddr ip 结构 指定 了 一 
个 AF_INET 地 址 。 它 试图 连接 到 IP 地 址 为 127.0.0.1 的 主机 上 的 服务 器 。 
它 用 inet_addr 函 数 将 了 地址 的 文本 表示 方式 转换 为 符合 套 接 字 地 址 要 求 
的 格式 。inet 的 手册 页 中 有 对 其 他 地 址 转换 函数 的 详细 说 明 。 


实 验 网 络 服务 器 

你 还 需要 修改 服务 器 程序 ， 让 和 它 在 选 好 的 端口 号 上 等 待 客户 的 连 
接 。 下 面 是 修改 过 的 服务 器 程序 server2.c。 

(1) 包含 必要 的 头 文件 并 设置 变量 : 

#include <sys/types.h> 

#include <sys/socket.h> 

#include <stdio.h> 


#include <netinet/in.h> 
#include <arpa/inet.h> 
finclude <unistd.h> 
finclude <stdlib.h> 


int server_sockfd, client_sockfd; 
int server_len, client_len; 

struct sockaddr_in server_address; 
struct sockaddr_in client_address; 


(2) 为 服务 器 创建 一 个 未 命名 套 接 字 : 
server_sockfd = socket (AF INET, SOCK STREAM, 0) ; 
(3) 命名 套 接 字 : 


server_address.sin_family = AF_INET; 
server_address.sin_addr.s_addr = inet_addr("127.0.0.1"); 
server_address.sin_port = 9734; 

server_len = sizeof {server_address) ; 


bind(server_sockfd, struct sockaddr *)&server_address, server_len 


从 这 以 后 的 代码 与 serverl.c 完 全 一 样 。 运 行 client2 和 server2 将 显示 
与 你 在 前 面 运行 client1 和 server1l 一 样 的 结果 。 

实验 解析 

服务 器 程序 创建 一 个 AF_INET 域 的 套 接 字 ， 并 安排 在 它 之 上 接受 连 
接 。 这 个 套 接 字 被 绑 定 到 你 选择 的 端口 。 指 定 的 地 址 决定 了 人 允许 建立 连 
接 的 计算 机 。 通 过 指定 像 客 户 程序 中 一 样 的 回路 地 址 ， 你 就 把 通信 限制 
在 本 地 主机 上 。 

如 果 想 允许 服务 器 和 远程 客户 进行 通信 ， 就 必须 指定 一 组 你 允许 连 
接 的 耳 地 址 。 你 可 以 用 特殊 值 INADDR_ANY 来 表示 ， 你 将 接受 来 自 计 
算 机 任何 网 络 接口 的 连接 。 如 果 你 愿意 ， 还 可 以 通过 分 离 如 内 部 局 域 网 
和 外 部 广域网 连接 的 方式 来 区 分 不 同 的 网 络 接口 。INADDR_ANY 是 一 
个 32 位 的 整数 值 ， 它 可 以 用 在 地 址 结构 的 sin_addr.s_addr 域 中 。 但 首先 
你 需要 解决 一 个 问题 ， 如 下 节 所 示 。 


15.2.10 


当 在 基于 Intel 处 理 圳 的 Linux 机 器 上 运行 新 版 本 的 服务 器 和 客户 程 
序 时 ， 我 们 可 以 用 netstat 命 令 来 得 看 网 络 连 接 状 况 。 这 个 命令 在 大 多 数 
配置 了 网 络 功能 的 UNIX 系 统 上 都 能 找到 。 它 显示 了 客户 /服务 占 连 接 正 
在 等 待 关 闭 。 连 接 将 在 一 小 段 超时 时 间 之 后 关闭 (具体 的 输出 内 容 将 随 
Linux 版 本 的 不 同 而 不 同 〉。 


$ ./server2 & ./client2 


“nar from server = B 
$ netstat -A inet 


ter 


在 尝试 运行 本 书 中 其 他 示例 程序 之 前 ， 请 确保 已 终止 正在 运 
行 的 示例 服务 器 程序 ， 因 为 它们 会 争夺 来 自 客户 的 连接 ， 会 导致 
运行 结果 混乱 。 你 可 以 用 下 面 的 命令 来 将 它们 《包括 本 章 后 面 将 
介绍 的 示例 程序 ) ERM: 


kilall server1 server2 server3 server4 server5 


你 可 以 看 到 这 条 连接 对 应 的 服务 器 和 客户 的 端口 号 。local address— 
栏 显示 的 是 服务 器 ， 而 foreign address 一 栏 显 示 的 是 远程 客户 (即使 是 在 


同一 台 机 器 上 ， 它 仍然 是 通过 网 络 连接 的 ) 。 为 了 确保 所 有 套 接 字 都 是 
不 同 的 ， 这 些 客户 端口 一 般 都 与 服务 器 监听 套 接 字 不 同 ， 并 且 在 这 台 计 
算 机 上 是 唯一 的 。 

可 是 ， 显 示 的 本 地 地 址 (服务 器 套 接 字 ) 端口 是 1574 (或 者 你 可 能 
会 看 到 显示 的 是 一 个 服务 名 mvel-lm) ， 而 我 们 选择 的 端口 是 9734。 为 
什么 会 不 一 样 呢 ? 答案 是 ， 通 过 套 接 字 接 口传 递 的 端口 号 和 地 址 都 是 二 
进 制 数字 。 不 同 的 计算 机 使 用 不 同 的 字 节 序 来 表示 整数 。 例 如 ，Intel 处 
理 器 将 32 位 的 整数 分 为 4 个 连续 的 字 节 ， 并 以 字 节 序 1-2-3-4 存 储 到 内 存 
中 ， 这 里 的 1 表示 最 高 位 的 字 节 。 而 IBM PowerPC 处 理 器 是 以 字 节 序 4-3- 
2-1 的 方式 来 存储 整数 。 如 果 保 存 整 数 的 内 存 只 是 以 逐个 字 节 的 方式 来 
复制 ， 两 个 不 同 的 计算 机 得 到 的 整数 值 就 会 不 一 致 。 

为 了 使 不 同类 型 的 计算 机 可 以 就 通过 网 络 传输 的 多 字 节 整数 的 值 达 
成 一 致 ， 你 需要 定义 一 个 网 络 字 节 序 。 客 户 和 服务 器 程序 必须 在 传输 之 
前 ， 将 它们 的 内 部 整数 表示 方式 转换 为 网 络 字 贡 序 。 它 们 通过 定义 在 头 
文件 netineUin.h 中 的 函数 来 完成 这 一 工作 。 这 些 函 数 如 下 所 示 : 


finclude <netinet/in.h> 


unsigned long int htonl(unsigned long int hostlong); 
unsigned short int htons(unsigned short int hostshort); 
unsigned long int ntohl(unsigned long int netlong) ; 
unsigned short int ntohs(unsigned short int netshort); 


IX HE PR BION LO AML A 3.2 fir HE BY TE ELSE He A os EN P28 SZ 
进行 转换 。 函 数 名 是 与 之 对 应 的 转换 操作 的 简写 形式 。 例 如 “host to 
network， long”(htonl， 长 整数 从 主机 字 节 序 到 网 络 字 节 序 的 转换 ) 
和 “host to network, short” (htons， 短 整数 从 主机 字 节 序 到 网 络 字 节 序 
的 转换 ) 。 如 果 计 算 机 本 映 的 主机 字 节 序 与 网 络 字 节 序 相同 ， 这 些 函 数 
的 内 容 实 际 上 就 是 空 操 作 。 

为 了 保证 16 位 的 端口 号 有 正确 的 字 节 序 ， 你 的 服务 问 和 客户 需要 用 
这 些 函 数 来 转换 端口 地 址 。 新 服务 器 程序 server3.c 中 的 改动 是 : 

server_address.sin_addr.s_addr = htonl(INADDR_ANY) ; 
server_address.sin_port = htons(9734); 

你 不 需要 对 函数 调用 inet_addr (“127.0.0.1”) 进行 转换 ， 因 为 
inet_addr 已 被 定义 为 产生 一 个 网 络 字 节 序 的 结果 。 新 客户 程序 client3.c 中 
的 改动 是 : 

address.sin_port = htons(9734); 


服务 器 也 做 了 改动 ， 通 过 用 INADDR_ANY 来 允许 到 达 服 务 器 任 一 
网 络 接口 的 连接 。 


现在 ， 运 行 server3 和 client3 时 ， 你 将 看 到 本 地 连接 使 用 的 是 正确 的 


请 记 住 ， 如 果 你 使 用 的 计算 机 上 的 主机 字 节 序 和 网 络 字 节 序 相 
同 ， 你 将 不 会 看 到 任何 差异 。 但 为 了 让 不 同体 系 结构 的 计算 机 上 的 
客户 和 服务 器 可 以 正确 地 操作 ， 总 是 在 网 络 程序 中 使 用 这 些 转 换 函 
数 仍然 是 非常 重要 的 。 


到 目前 为 止 ， 我 们 的 客户 和 服务 器 程 序 一 直 是 把 地 址 和 端口 号 编译 
到 它们 自己 的 内 部 。 对 于 一 个 更 通用 的 服务 器 和 客户 程序 来 说 ， 我 们 可 
以 通过 网 络 信息 函数 来 决定 应 该 使 用 的 地 址 和 端口 。 

如 果 你 有 由 够 的 权限 ， 也 可 以 将 自己 的 服务 添加 到 /etc/services 文 件 
中 的 已 知 服务 列表 中 ， 并 在 这 个 文件 中 为 端口 写 分 配 一 个 名 字 ， 使 用 户 
可 以 使 用 符号 化 的 服务 名 而 不 是 端口 号 的 数字 。 

类 似 地 ， 如 果 给 定 一 个 计算 机 的 名 字 ， 你 可 以 通过 调用 解析 地 址 的 
主机 数据 库 函 数 来 确定 它 的 卫 地 址 。 这 些 函 数 通过 查询 网 络 配置 文件 来 
完成 这 一 工作 ， 如 /etchosts 文 件 或 网 络 信息 服务 。 负 用 的 网 络 信息 服务 
ANIS (Network Information Service， 网 络 信息 服务 ， 以 前 称 为 Yellow 
Pages， 黄 页 服务 ) 和 DNS (Domain Name Service， 域 名 服务 ) 。 

主机 数据 库 函 数 在 接口 头 文件 netdb.h 中 声明 ， 如 下 所 示 : 


#include <netdb.h> 


struct hostent *gethostbyaddr(const void *addr, size_t len, int type); 
struct hostent *gethostbyname(const char *name); 


这 些 函数 返回 的 结构 中 至 少 会 包含 以 下 几 个 成 员 : 
struct hostent { 
char *h_name; /* name of the host */ 
char **h aliases; /* list of aliases (nicknames) */ 
int h_addrtype; /* address type */ 
int h_length; /* length in bytes of the address */ 
char **h_addr list /* list of address (network order) */ 
}; 
如 果 没 有 与 我 们 查询 的 主机 或 地 址 相关 的 数据 项 ， 这 些 信息 函数 将 
返回 一 个 空 指针 。 
类 似 地 ， 与 服务 及 其 关联 端口 号 有 关 的 信息 也 可 以 通过 一 些 服 务 信 
FA PR BOR RA 如 下 所 示 : 


#include <netdb.h> 


struct servent *getservbyname(const char *name, const char *proto); 
struct servent *getservbyport (int port, const char *proto); 


proto 参 数 指定 用 于 连接 该 服务 的 协议 ， 它 的 两 个 取 值 是 tcp 和 udp， 
前 者 用 于 SOCK_STREAM 类 型 的 TCP 连 接 ， 后 者 用 于 SOCK_DGRAM 类 
型 的 UPD 数 据 报 。 

结构 servent 至 少 包 含 以 下 几 个 成 员 : 


struct servent { 
char *s_name; /* name of the service */ 
char **s aliases; /* list of aliases (alternative names) */ 
int s_port; /* The IP port number */ 
/ 


char *s proto; * The service type, usually "tcp" or “udp” */ 


如 有 果 想 获得 某 台 计算 机 的 主机 数据 库 信息 ， 可 以 调用 gethostbyname 
函数 并 且 将 结果 打印 出 来 。 注 意 ， 要 把 返回 的 地 址 列表 转换 为 正确 的 地 
址 类 型 ， 并 用 函数 inet_ntoa 将 它们 从 网 络 字 厄 序 转换 为 可 打印 的 字符 
串 。 函 数 inet_ntoa 的 定义 如 下 所 示 : 


#include <arpa/inet.h> 


char *inet_ntoa(struct in_addr in) 


这 个 函数 的 作用 是 ， 将 一 个 因特网 主机 地 址 转换 为 一 个 点 分 四 元 组 
格式 的 字符 串 。 它 在 失败 时 返回 -1， 但 POSIX 规 范 并 未 定义 任何 错误 。 
其 他 可 用 的 新 函数 还 有 gethostname， 它 的 定义 如 下 所 示 : 


#include <unistd.h> 


int gethostname(char *name, int namelength); 


这 个 函数 的 作用 是 ， 将 当前 主机 的 名 字 写 入 name 指 向 的 字符 串 中 。 
主机 名 将 以 nu 结尾 。 参 数 namelength 指 定 了 字符 串 name 的 长 度 ， 如 采 
返回 的 主机 名 太 长 ， 它 就 会 被 截断 。gethostname 在 成 功 时 返回 0， 失 败 
时 返回 -1， 但 POSIX 规 范 中 没有 定义 任何 错误 。 


X 验 网 络 信息 
下 面 这 个 程序 getname.c 用 来 获取 一 台 主 机 的 有 关 信 息 。 
(1) SERRE, FL EIA CEE HEE: 


include <netin in.h> 
| ary 


(2) 把 host 变 量 设置 为 getmame 程 序 所 提供 的 命令 行 参数 ， 或 默认 
设置 为 用 户主 机 的 主机 名 : 


地 址 。 


aw 
信息 。 


(3) 调用 gethostbyname， 如 果 未 找到 相应 的 信息 就 报告 一 


Wt get info for host: ts\n*, host); 


W 显示 二 机 名 和 它 可 EE 有 的 所 有 别名 : 


条 错 


CS) 如果 查询 的 主机 不 是 一 人 主机， 就 发 出 警告 并 退出 : 


if {hostinfo -> h_addrtyr != AF_INET) 
fprintf(stderr, “not an IP host!\n’); 
exit (1); 


(6) 否则 ， 显 示 它 的 所 有 IP 地 址 : 


while 


此 外 ， 你 也 可 以 用 gethostbyaddr 函 数 来 得 出 哪个 主机 拥有 给 定 的 了 


你 可 以 在 服务 器 上 用 这 个 函数 来 查找 连接 客户 的 来 源 。 
实验 解析 


getname 程 序 通过 调用 gethostbyname 从 主机 数据 库 中 提取 出 主机 的 


它 打 印 出 主机 名 、 它 的 别名 《这 合计 算 机 的 其 他 名 字 ) 和 该 主机 


在 它 的 网 络 接口 上 使 用 的 耳 地 址 。 运 行 这 个 示例 程序 并 指定 主机 名 tilde 
程序 给 出 了 以 太 网 和 调制 解 调 喜 两 个 网 络 接口 的 信息 。 如 下 所 未 : 


时 ， 


S ./getname tilde 
results for host tilde: 
Name: tilde.localnet 
Aliases: tilde 


ToS. ToB dd 198. 152K. xX 
当 我 们 使 用 主机 名 localhost 时 ， 程 序 只 给 出 了 回路 网 络 的 信 ， 


下 所 示 : 


Eo W 


$ ./getname localhost 
results for host localhost: 


Name: 


localhost 


Aliases: 


l2?. 


Wowk 


现在 可 以 改进 我 们 的 客户 程序 ， 使 它 可 以 连接 到 任何 有 名 字 的 主 


机 。 这 次 不 是 连接 到 我 们 的 示例 服务 器 ， 而 是 连接 到 一 个 标准 服务 ， 这 
样 承 可 以 演示 端口 号 的 提取 操作 了 。 

大 多 数 UNIX 和 一 些 Linux 系 统 都 有 一 项 标准 服务 daytime， 它 提供 系 
统 的 日 期 和 时 间 。 客 户 可 以 连接 到 这 个 服务 来 得 看 服务 器 的 当前 日 期 和 


时 间 。 下 面 就 是 完成 这 一 工作 的 客户 程序 getdate.c。 


(1) 


#include 
#include 
#include 
#include 
#include 
#include 


int main( 


连接 到 标准 服务 


包含 必要 的 头 文件 和 变量 声明 : 


<sys/socket.h> 


<netinet/in.h> 
<netdb.h> 
<stdio.h> 
<unistd.h> 


<stdlib.h> 


int argc, char *argv[]) 


char *host; 
int sockfd; 


int 


etry 
stru 


len, result; 


ct sockaddr_in address; 


struct hostent *hostinfo; 


stru 


char 


ct servent *servinfo; 


buffer[128); 


f {arge == 1) 


host = "localhost"; 


host = argv[l]; 


(2) 查找 主机 的 地 址 ， 如 果 找 不 到 ， 束 报告 一 条 错误 : 


hostinfo = gethostbyname (host); 
if(thostinfo} { 
fprintf(stderr, "no host: %s\n", host); 
exit{1); 


(3) 检查 主机 上 是 否 有 daytime 服 务 : 


servinfo = getservbyname("daytime", "tcp"); 
if(!servinfo) { 
fprintf(stderr, "no daytime service\n"); 
exit(i); 


printf("daytime port is %d\n", ntohs(servinfo -> s_port)); 


(4) 创建 一 个 套 接 字 : 
sockfd = socket (AF_INET, SOCK_STREAM, 0) ; 
(5) 构造 connect 调 用 要 使 用 的 地 址 : 


agaress.sin_ramıiiy = AF_LNST; 

address.sin_port = servinfo -> s_port; 

address.sin_addr = *(struct in_addr *)*hostinfo -> h_addr_list; 
len = sizeof (address); 


X a y 2 ay N at 
(6) 然后 建立 连接 并 取得 有 关 信 息 : 
result = connect(sockfd, [struct sockaddr ")&address, Lenl ; 
if {result == -1) { 
perror("oops: getdate"); 
exit(l); 


) 


result = read(sockfd, buffer, sizeof(buffer)); 
buffer[{result] = '\0'; 
printf£("*read td bytes: $s", result, buffer); 


close(sockfd); 
exit(0); 


你 可 以 用 getdate 获 取 任 一 已 知 主机 的 日 期 和 时 间 。 


$ ./getdate localhost 

daytime port is 13 

read 26 bytes: 24 JUN 2007 06:03:03 BST 
$ 


如 果 你 看 到 如 下 所 示 的 一 条 错误 信息 : 
oops: getdate: Connection refused 
或 是 : 


oops: getdate: No such file or directory 


这 可 能 是 因为 你 正在 连接 的 计算 机 没有 启用 daytime 服 务 。 最 新 版 
本 的 Linux 系 统 在 默认 情况 下 都 没有 局 用 该 服务 。 在 下 一 节 中 ， 你 将 学 
习 如 何 启用 这 项 服务 以 及 其 他 一 些 服 务 。 

实验 解析 

运行 这 个 程序 时 ， 你 可 以 指定 要 连接 的 主机 。daytime 服 务 的 端口 
号 是 通过 网 络 数据 库 函 数 getservbyname 来 确定 的 ， 该 函数 以 与 返回 主机 
言 恩 类 似 的 方法 返回 和 网 络 服务 相关 的 信息 。 程 序 getdate 党 试 连 接 到 指 
定 主 机 返回 的 地 址 列表 中 的 第 一 个 地 址 ， 如 果 成 功 ， 它 就 读 取 daytime 
服务 返回 的 信息 一 一 一 个 表示 UNIX 日 期 和 时 间 的 字符 串 。 


UNIX 系 统 通 弟 以 超级 服务 器 的 方式 来 提供 多 项 网 络 服务 。 超 级 服 
务 器 程序 (因特网 守护 进程 xinetd 或 inetd〉 同时 监听 许多 端口 地 址 上 的 
连接 。 当 有 客户 连接 到 某 项 服务 时 ， 守 护 程 序 就 运行 相应 的 服务 器 。 这 
een 直 运 行 着 ， 它 们 可 以 在 需要 时 
HA) o 


特 网 守护 进程 在 现代 Linux 系 统 中 是 通过 xinetd 来 实现 的 。 
Xinetd 实 现 方 式 取 代 了 原来 的 UNIX 程 序 inetd， 尽 管 你 仍然 会 在 一 些 
较 老 的 Linux 系 统 中 以 及 其 他 的 类 UNIX 系 统 中 看 到 inetd 的 应 用 。 


我 们 通常 是 通过 一 个 图 形 用 户 界面 来 配置 xinetd 以 管理 网 络 服 务 ， 
但 我 们 也 可 以 直接 修改 它 的 配置 文件 。 它 的 配置 文件 通常 
是 /etc/xinetd.conf 和 /etc/xinetd.d 目 录 中 的 文件 。 

每 一 个 由 xinetd 提 供 的 服务 都 在 /etc/xinetd.d 目 录 中 有 一 个 对 应 的 配 
置 文件 。xinetd 将 在 其 启动 时 或 被 要 求 的 情况 下 读 取 所 有 这 些 配 置 文 


fis 
下 面 是 一 些 xinetd 配 置 文件 的 例子 ， 首 先是 daytime 服 务 的 配置 : 


然后 是 文件 传输 服务 的 配置 : 


e vsftpd FTP server serves FTI naect r 
encrypted usernames ana passwords for authentication 


我 们 的 getdate 程 序 连接 的 daytime 服 务实 际 上 就 是 由 xinetd 自 喘 负 责 
处 理 的 ( 它 被 标记 为 internal， 即 内 部 )， 它 同时 支持 
SOCK_STREAM (tcp) 和 SOCK_DGRAM (udp) 套 接 字 。 

ftp 文 件 传输 服务 只 支持 SOCK_STREAM 套 接 字 ， 并 且 是 由 一 个 外 
部 程序 来 提供 服务 的 。 在 本 例 中 这 个 程序 是 vsftpd， 当 有 客户 连接 到 ftp 
的 端口 时 ， 守 护 进 程 就 会 启动 它 。 

为 了 激活 服务 配置 的 修改 ， 你 需要 编辑 xinetd 的 配置 文件 ， 然 后 发 
送 一 个 挂 起 信号 给 守护 进程 ， 但 我 们 建议 你 使 用 一 种 更 加 友好 的 方式 来 
配置 服务 。 为 了 人 允许 time-of-day 客 户 进行 连接 ， 你 可 以 使 用 Linux 系 统 提 
供 的 工具 来 启用 daytime 服 务 。 对 于 SUSE 和 openSUSE 系 统 来 说 ， 你 可 以 
通过 SUSE 控 制 中 心 来 配置 服务 ， 如 图 15-1 所 示 。Red Hat 的 版 本 (包括 
企业 版 Linux 和 Fedora) 也 有 一 个 类 似 的 配置 界面 。 在 网 15-1 中 ， 
daytime 服 务 同 时 针对 TCP 和 UDP 查询 进行 了 启用 。 

对 于 使 用 inetd 而 不 是 xinetd 的 系统 来 说 ， 下 面 是 从 inetd 的 配置 文 
件 /etc/inetd.conf 中 提取 的 完成 相同 功能 的 配置 ，inetd 使 用 该 配置 文件 来 
决定 运行 哪些 服务 器 : 


š 
# <service_name> <sock_type> <proto> <flags> <user> <server_path> <args> 


i 

# Echo, discard, daytime, and chargen are used primarily for testing. 
# 

daytime stream tcp nowait root internal 

daytime a@gram udp wait root internal 

$ 


4 These are standard services. 


. 

ftp stream tcp nowait root /usr/sbin/tcpd /usr/sbin/wu. ftpa 
telnet stream tcp nowait root fusr/sbin/tepd /asr/sbin/in.telnetd 
a 

1 End of inetd.conf, 
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注意 ， 在 本 例 中 ，ftp 服 务 是 由 外 部 程序 wu.ftpd 提 供 的 。 如 果 你 的 系 
统 运 行 着 inetd 进 程 ， 你 可 以 通过 编辑 文件 /etcinetd.conf〈 一 行 开头 的 # 
号 表示 这 是 一 个 注释 行 ) 再 重新 启动 inetd 进 程 的 方法 来 改变 提供 的 服 
务 。 你 可 以 用 Kill 命令 癌 inetd 进 程 发 送 一 个 挂 起 信号 来 重启 该 进程 。 为 
了 方便 执行 这 个 操作 ， 有 的 系统 会 配置 成 让 inetd 将 它 的 进程 号 写 入 一 个 
文件 中 。 此 外 ， 你 还 可 以 使 用 killall 命 令 ， 如 下 所 示 : 
# killall -HUP inetd 


15.3.2 字 选 项 
你 可 以 用 许多 选项 来 控制 套 接 字 连 接 的 行为 ， 这 些 选项 的 数目 众 


多 ， 我 们 不 可 能 在 这 里 对 它们 一 一 解释 。setsockopt 函 数 用 于 控制 这 些 
选项 ， 它 的 定义 如 下 所 示 : 
#include <sys/socket.h> 


int setsockopt (int socket, int level, int option name, 
const void *option value, size_t option_len); 


你 可 以 在 协议 层次 的 不 同 级 别 对 选项 进行 设置 。 如 果 想 要 在 套 接 字 
级 别 设置 选项 ， 就 必须 将 level 参 数 设 置 为 SOL_SOCKET。 如 有 果 想 要 在 
底层 协议 级 别 〈( 如 TCP、UDP 等 ) 设置 选项 ， 就 必须 将 level 参 数 设置 为 
该 协议 的 编写 出 (可 以 通过 头 文件 netinet/in.h 或 函数 getprotobyname 来 获 
ft) s 

option name# S48 EC BK EMM; option vaue#AN KEN 
option_len 字 节 ， 它 用 于 设置 选项 的 新 值 ， 它 被 传递 给 底层 协议 的 处 理 
函数 ， 并 且 不 能 被 修改 。 

在 头 文件 sys/socketh 中 定义 的 套 接 字 级 别 选 项 ， 如 表 15-5 所 示 。 


表 15-5 
$o Om 
SO_DEBUG 和 SO_KEEPALIVE 用 一 个 整数 的 option_value 值 来 设置 
该 选项 的 开 (1) 或 关 0) 。SO_LINGER 需 要 使 用 一 个 在 头 文件 
sys/socket.h 中 定义 的 linger 结 构 ， 来 定义 该 选项 的 状态 以 及 套 接 字 关闭 之 
前 的 拖延 时 间 。 
setsockopt 在 成 功 时 返回 0， 失 败 时 返回 -1。 它 的 手册 页 介绍 了 更 多 
的 选项 和 错误 。 
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到 目前 为 止 ， 本章 一 直 介 绍 的 是 ， 如 何 用 套 接 字 来 实现 本 地 的 和 跨 
网 络 的 客户 /服务 器 系统 。 一 旦 连接 建立 ， 套 接 字 连接 的 行为 就 类 似 于 
打开 的 底层 文件 描述 符 ， 而 且 在 很 多 方面 类 似 于 双向 管道 。 

我 们 现在 来 考虑 有 多 个 客户 同时 连接 一 个 服务 器 的 情况 。 你 已 经 看 
到 ， 服 务 器 程序 在 接受 来 自 客 户 的 一 个 新 连接 时 ， 会 创建 出 一 个 新 的 套 
接 字 ， 而 原先 的 监听 套 接 字 将 被 保留 以 继续 监听 以 后 的 连接 。 如 果 服 务 
器 不 能 立刻 接受 后 来 的 连接 ， 它 们 将 被 放 到 队列 中 以 等 待 处 理 。 

原先 的 套 接 字 仍然 可 用 并 且 套 接 字 的 行为 就 像 文件 描述 符 ， 这 一 事 
实 给 我 们 提供 了 一 种 同时 服务 多 个 客户 的 方法 。 如 果 服 务 器 调用 fork 为 
自己 创建 第 三 份 副 本 ， 打 开 的 套 接 字 就 将 被 新 的 子 进 程 所 继承 。 新 的 子 
进程 可 以 和 连接 的 客户 进行 通信 ， 而 主 服 务 器 进程 可 以 继续 接受 以 后 的 
客户 连接 。 这 些 改动 对 我 们 的 服务 器 程序 来 说 是 非常 容易 的 ， 下 面 的 实 
验 部 分 将 给 出 修改 过 的 服务 器 程序 。 

因为 我 们 创建 子 进程 ， 但 并 不 等 待 它们 的 完成 ， 所 以 必须 安排 服务 
髓 忽略 SIGCHLD 信 号 以 避免 出 现 僵尸 进程 饼 


X 验 可 以 同时 服务 多 个 客户 的 服务 器 

(1) 这 个 程序 server4.c 的 开始 部 分 与 我 们 前 面 的 服务 嚣 一脉相承 ， 
只 是 增加 了 一 条 包含 signal.h 头 文件 的 ipclude 语 句 。 变 量 的 定义 和 创建 、 
命名 套 接 字 的 过 程 与 以 前 一 样 : 


(2) 创建 一 个 连接 队列 ， 忽 略 子 进程 的 退出 细节 ， 等 待 客户 的 到 


(A) ) 通过 fork 调 用 为 这 个 客户 创建 一 个 子 进程 ， 然后 测试 你 是 在 父 
进程 中 还 是 在 子 进程 中 : 


1f(fork() == 0) í 


(5) 如果 你 是 在 子 进 程 中 ， 就 可 以 对 client_sockfd 上 的 客户 执行 读 / 
SPRY. 5 秒 的 延迟 只 是 出 于 演示 的 目的 : 


(6) 否则 ， 你 一 定 是 在 父 进程 中 ， 你 只 需 关闭 这 个 客户 : 
else { 


在 处 理 客户 请 求 时 插入 的 5 秒 延 迟 是 为 了 模拟 服务 器 的 计算 时 间或 
数据 库 访 问 时 间 。 如 果 在 前 面 的 服务 器 中 这 样 做 ，client3 的 每 次 运行 都 
将 花费 5 秒 钟 的 时 间 。 do il 处 理 多 个 client3 程 序 ， 所 花 
费 的 总 时 间 将 只 有 5 秒 钟 多 一 


实验 解析 

服务 器 程序 现在 将 创建 一 个 新 的 子 进程 来 处 理 每 个 客户 ， 所 以 你 将 
看 到 好 几 个 服务 器 在 等 待 消息 ， 而 主 进程 将 继续 等 竺 新 的 连接 。ps 命 令 
的 输出 (这 里 进行 了 编辑 ) 显示 ，PID 为 26566 的 server4 进 程 正 在 等 待 新 
的 客户 ， 而 3 个 client3 进 程 正在 由 3 个 服务 器 的 子 进程 进行 服务 。 在 经 过 
5 秒 的 暂停 后 ， 所 有 的 客户 都 得 到 了 它们 的 结果 并 结束 运行 。 服 务 器 的 
子 进程 也 都 退出 ， 只 留 下 主 服务 器 进程 在 运行 。 

服务 器 程序 用 fork 函 数 来 处 理 多 个 客户 。 但 在 数据 库 应 用 程序 中 ， 
这 可 能 不 是 最 佳 的 解决 方案 。 因 为 服务 器 程序 可 能 会 相当 大 ， 而 且 在 数 
据 库 访 问 方 面 还 存在 着 需要 协调 多 个 服务 器 副本 的 问题 。 事 实 上 ， 我 们 
真正 需要 的 是 ， 如 何 让 单个 服务 器 进程 在 不 阻塞 、 不 等 竺 客户 请 求 到 达 
的 前 提 下 处 理 多 个 客户 。 这 个 问题 的 解决 方案 涉及 如 何 同 时 处 理 多 个 打 


开 的 文件 描述 符 ， 并 且 它 不 仅仅 局 限于 套 接 字 应 用 程序 ， 请 看 下 一 节 的 
select 系 统 调 用 。 


在 编写 Linux 应 用 程序 时 ， 我 们 经 常会 遇 到 需要 检查 好 几 个 输入 的 
状态 才能 确定 下 一 步行 动 的 情况 。 例 如 ， 像 终端 仿真 右 这 样 的 通信 程 
序 ， 需 要 有 效 地 同时 读 取 键 盘 和 单行 口 。 如 果 是 在 一 个 单 用 户 系统 中 ， 


运行 一 个 “ 忙 等 待 ”循环 还 是 可 以 接受 的 ， 它 不 停 地 扫描 输入 设备 看 是 否 
有 数据 ， 如 果 有 数据 到 达 就 读 取 它 。 但 这 种 做 法 很 消耗 CPU 的 时 间 。 

select 系 统 调 用 人 允许 程序 同时 在 多 个 底层 文件 描述 符 上 等 待 输入 的 
到 达 《 或 输出 的 完成 )》 。 这 意味 着 终端 仿真 程序 可 以 一 直 阻 堵 到 有 事情 
可 做 为 止 。 类 似 地 ， 服 务 器 也 可 以 通过 同时 在 多 个 打开 的 套 接 字 上 等 待 
请 求 到 来 的 方法 来 处 理 多 个 客户 。 

Select 六 数 对 数据 结构 fdq_set 进 行 操作 ， 它 是 由 打开 的 文件 描述 符 构 
成 的 集合 。 有 一 组 定义 好 的 宏 可 以 用 来 控制 这 些 集合 : 

#include <sys/types.h> 

#include <sys/time.h> 


void FD_ZERO(fd_set *fdset) ; 

void FD _CLR(int fd, fd_set *fdset); 

void FD _SET(int fd, fd_set *fdset); 

int FD _ISSET(int fd, fd_set *fdset) ; 


顾名思义 ，FD_ZERO 用 于 将 fd_set 初 始 化 为 空 集合 ，FD_SET 和 
FD_CLR 分 别 用 于 在 集合 中 设置 和 清除 由 参数 fd 传递 的 文件 描述 符 。 如 
末 FD_ISSET 宏 中 由 参数 fd 指 同 的 文件 摘 述 符 是 由 参数 fdset 指 回 的 fd_set 
集合 中 的 一 个 元 素 ，FD_ISSET 将 返回 非 零 值 。fd_set 结 构 中 可 以 容纳 的 
文件 描述 符 的 最 大 数目 由 常量 FD_SETSIZE 指 定 。 

select 疯 数 还 可 以 用 一 个 超时 值 来 防止 无 限期 的 阻塞 。 这 个 超时 值 
由 一 个 timeval 结 构 给 出 。 这 个 结构 定义 在 头 文 件 sys/time.h 中 ， 它 由 以 下 
几 个 成 员 组 成 : 

struct timeval { 
time t tv_sec; /* seconds */ 
long tv_usec; /* microseconds */ 


} 
类 型 time_t 文 件 sys/types.h 中 被 定义 为 一 个 整数 类 型 。 
select 系 统 调用 的 原型 如 下 所 示 ; 


#include <sys/types.h> 
#include <sys/time.h> 


int select(int nfds, fd_set *readfds, fd_set *writefds, 
fd_set *errorfds, struct timeval *timeout); 


select 调 用 用 于 测评 文件 描述 符 集 合 中 ， 是 否 有 一 个 文件 描述 符 已 
处 于 可 读 状 态 或 可 写 状 态 或 错误 状态 ， 它 将 阻塞 以 等 竺 某 个 文件 描述 符 
进入 上 述 这 些 状态 。 

参数 nfds 指 定 需要 测试 的 文件 描述 符 数 目 ， 测 试 的 描述 符 范 围 从 0 
到 nfds-1。3 个 描述 符 集 合 都 可 以 被 设 为 空 指针 ， 这 表示 不 执行 相应 的 测 


io 

select 国 数 会 在 发 生 以 下 情况 时 返回 : readfds 集 合 中 有 描述 符 可 
读 、writefds 集 合 中 有 描述 符 可 写 或 errorfds 集 合 中 有 描述 符 遇 到 错误 条 
件 。 如 果 这 3 种 情况 都 没有 发 生 ，select 将 在 timeout 指 定 的 超时 时 间 经 过 
后 返回 。 如 果 timeout 参 数 是 一 个 空 指针 并 且 套 接 字 上 也 没有 任何 活动 ， 
这 个 调用 将 一 直 阻 塞 下 去 。 

当 select 返 回 时 ， 摘 述 符 集合 将 被 修改 以 指示 哪些 描述 符 正 处 于 可 
读 、 可 写 或 有 错误 的 状态 。 我 们 可 以 用 FD_ISSET 对 描述 符 进 行 测试 ， 
来 找 出 需要 注意 的 描述 符 。 你 可 以 修改 timeout 值 来 表明 剩余 的 超时 时 
间 ， 但 这 并 不 是 在 X/Open 规 苑 中 定义 的 行为 。 如 果 select 是 因为 超时 而 
返回 的 话 ， 所 有 描述 符 集 合 都 将 被 清空 。 

select 调 用 返回 状态 发 生变 化 的 描述 符 总 数 。 失 败 时 它 将 返回 -1 并 设 
置 errno 来 描述 错误 。 可 能 出 现 的 错误 有 : EBADF (无 效 的 描述 符 ) 、 
EINTR (HF WTR ~ EINVAL (nfds 或 timeout 取 值 错误 )。 


虽然 Linux 系 统 会 把 参数 timeout 指 同 的 结构 修改 为 剩余 的 超时 
时 间 ， 但 大 多 数 UNIX 版 本 不 会 这 样 做 。 许 多 现 有 的 使 用 select 函 数 
的 代码 在 初始 化 timeval 结 构 后 ， 束 一 直 使 用 它 而 不 会 重新 初始 化 它 
的 内 容 。 但 这 些 代 码 在 Linux 系 统 上 可 能 会 工作 不 正常 ， 因 为 Linux 
会 在 每 次 select 调 用 返回 时 修改 timeval 结 构 。 如 果 你 正在 编写 或 移 
植 使 用 Select 函数 的 代码 ， 束 需要 注意 这 一 区 别 ， 并 且 总 是 重新 初 
始 化 timeout。 注 意 ， 这 两 种 行为 都 是 正确 的 ， 但 它们 确实 不 同 ! 


实验 select 系统 调 用 

下 面 这 个 程序 select.c 演 示 了 select 函 数 的 使 用 方法 。 我 们 稍 后 还 会 
看 到 一 个 更 复杂 的 例子 。 这 个 程序 读 取 键盘 《〈 即 标准 输入 一 一 文件 描述 
符 为 0) ， 超 时 时 间 设 为 2.5 秒 。 它 只 有 在 输入 惑 绪 时 才 读 取 键 盘 。 它 可 
以 很 容易 地 通过 添加 其 他 摘 述 符 〈 如 串 行 线 、 管 道 、 套 接 字 等 ) 进行 扩 
展 ， 具 体 做 法 取决 于 应 用 程序 的 需要 。 

(1) 开始 部 分 还 是 与 往常 一 样 ， 包 含 必要 的 头 文件 和 变量 声明 ， 
然后 对 inputs 进 行 初始 化 以 处 理 来 和 目 键 盘 的 输入 : 


stidi 


FD ZERO(&inputs}:; 
|z k - 


(2) 在 标准 输入 stdin 上 最 多 等 待 输入 2.5 秒 : 


SETSIZE, &testfds, fd_set *)NULL fd_set *)NULL 


(3) 经 过 这 段 时 间 之 后 ， 我 们 对 result 进 行 测试 。 如 果 没 有 输入 ， 
程序 将 再 次 循环 。 如 果 出 现 一 个 错误 ， 程 序 将 退出 运行 : 


(A) 如 果 在 等 待 期 间 ， 你 对 文件 描述 符 采取 了 一 些 动作 ， 程 序 就 
将 读 取 标准 输入 stdin 上 的 输入 ， 并 在 接收 到 行 尾 字符 后 把 它们 都 回 显 到 
屏幕 上 ， 当 你 输入 的 字符 是 Cul+D 时 ， 就 退出 程序 : 


运行 这 个 程序 时 ， 它 会 每 隔 2.5 秒 打印 一 个 timeout。 如 果 在 键盘 上 
MATI ERR MO HET A HEF AIA. KEEL 
shell 来 说 ， 输 入 会 在 用 户 按 下 回 车 键 或 某 个 控制 序列 时 被 发 送 给 程序 ， 
所 以 这 个 程序 将 在 你 按 下 回 车 键 时 把 输入 内 容 显示 出 来 。 注 意 ， 回 车 键 


本 身 也 像 其 他 字符 一 样 被 读 取 和 处 理 〈 你 可 以 尝试 不 按 下 回 车 键 ， 而 是 
在 裔 入 几 个 字符 后 按 下 组 合 键 Ctrl+D， 看 看 会 怎么 样 ) 。 


hello 


fred 


实验 解析 

这 个 程序 用 select 调 用 来 检查 标准 输入 的 状态 。 程 序 通 过 事先 安排 
的 超时 时 间 每 隔 2.5 秒 打印 一 个 timeout 信 息 ， 这 是 通过 select 调 用 返回 0 来 
判断 的 。 在 文件 的 结尾 ， 标 准 输入 描述 符 被 标记 为 可 读 ， 但 没有 字符 可 
以 读 取 。 


15.4.2 ”多 客户 


我 们 的 简单 服务 器 程序 可 以 从 select 调 用 中 获得 益处 ， 通 过 用 select 
调用 来 同时 处 理 多 个 客户 就 无 需 再 依赖 于 子 进程 了 。 但 在 把 这 个 技巧 应 
用 到 实际 的 应 用 程序 中 时 ， 你 必须 要 注意 ， 不 能 在 处 理 第 一 个 连接 的 客 
户 时 让 其 他 客户 等 太 长 的 时 间 。 

服务 器 可 以 让 select 调 用 同时 检查 监听 套 接 字 和 客户 的 连接 套 接 
字 。 一 旦 select 调 用 指示 有 活动 发 生 ， 就 可 以 用 FD_ISSET 来 表 历 所 有 可 
能 的 文件 描述 符 ， 以 检查 是 哪个 上 面 有 活动 发 生 。 

如 果 是 监听 套 接 字 可 读 ， 这 说 明正 有 一 个 客户 试图 建立 连接 ， 此 时 
了 怠 可 以 调用 accept 而 不 用 担心 发 生 阻 夏 的 可 能 。 如 果 是 某 个 客户 摘 述 符 
准备 好 ， 这 说 明 该 描述 符 上 有 一 个 客户 请 求 需要 我 们 读 取 和 处 理 。 如 果 
读 操作 返回 零 字 节 ， 这 表示 有 一 个 客户 进程 已 结束 ， 你 可 以 关闭 该 套 接 
字 并 把 它 从 描述 符 集 合 中 删除 。 


K 验 一 个 改进 的 多 客户 /服务 器 
(1) 作为 本 章 最 后 一 个 例子 server5.c， 我 们 用 头 文件 sys/time.h 和 
sys/ioctl.h 蔡 换 掉 上 一 个 程序 中 的 signal.h， 并 且 为 select 调 用 定义 了 一 些 


变量 : 


idres 


D ) 为 服务 器 创建 并 全 


os 连接 队列 ， See E ee 和 
全 入 : 


isten(server_sockfd, 


server_sockfd, &reac 


(4) 现在 开始 等 待 客户 和 请 求 的 到 来 。 ap ens avai 
了 一 个 空 指针 ， 所 以 select 调 用 将 不 会 发 生 超时 。 如 果 select 调 用 的 返 
值 小 于 1， 程 序 将 退出 并 报告 出 现 的 错误 : 


(5) 一 旦 你 得 知 有 活动 发 生 ， Bo eee 
述 符 ， 以 发 现 活动 发 生 在 哪个 描述 
for(fd = 0; fd < FD_SETSIZE; fd++) { 
if (FD_ISSET (fd, &testfds i 


(6) 如 果 活 动 是 发 生 在 套 接 字 server_sockfd 上 ， 它 肯定 是 一 个 新 的 
连接 请 求 ， 你 就 把 相关 的 client_sockfd 添 加 到 描述 符 集 合 中 : 


(7) 如 果 活 动 不 是 发 生 在 服务 器 套 接 字 上 ， 那 肯定 是 客户 的 活 
动 。 如 琳 接 收 到 的 活动 是 dose， 束 说 明 客 成 已 经 离开 ， 你 可 以 把 该 客户 


的 套 接 字 从 描述 符 集 合 中 删除 。 人 否则 ， 惑 可 以 像 前 面 的 例子 那样 为 客户 
进行 服务 。 


1 client on fd $d\n", £d) 


在 实际 应 用 的 程序 中 ， 最 好 用 一 个 变量 来 专门 保存 已 连接 套 接 
字 的 最 大 文件 描述 符号 《〈 筷 不 一 定 是 最 新 连接 的 套 接 字 文 件 描述 符 
F) 。 这 可 以 避免 循环 检查 数 干 个 其 实 并 未 连接 的 套 接 字 ， 它 们 根 
本 不 可 能 处 于 可 读 状态 。 出 于 简洁 和 让 代码 易于 理解 的 目的 ， 我 们 
在 这 里 没有 这 样 做 。 


运行 服务 器 的 这 个 版 本 时 ， 它 将 在 一 个 进程 中 对 多 个 客户 依次 进行 
处 理 。 


$ ./serverS & 
[1] 26686 
server waiting 


$ ./elient3 & ./client3 & ./client3 & ps x 


[2】 26689 

[3} 26690 

adding client on fd 4 
server waiting 


[4] 26691 

PID TTY STAT TIME COMMAND 
26686 pts/l S 0:00 ./servers 
26689 pts/1 S 0:00 ./client3 
26690 pts/1 S 0:00 ./client3 
26691 pts/i S 0:00 ./client3 
26692 pts/1 R» 


0:00 ps x 
$ serving client on fd 4 

server waiting 

adding client on fd 5 

server waiting 

adding client on fd 6 

char from server = B 

serving client on fd 5 

server waiting 
removing client on É 
char from server = 8 
serving client on fd 
server waiting 
removing client on fd 5 
server waiting 

char from server = B 
removing client on fd 6 
server waiting 


Ca 


6 


{2} Done ./elient3 
[3]- Done ./client3 
{4]+ Done ./elient3 


为 了 让 本 章 开 头 的 类 比 更 完整 ， 表 15-6 对 和 套 接 字 连 接 和 电话 接 入 进 


行 了 对 比 。 


t 话 
给 会 可 打 电 话 ， 号 码 基 553-0828 
接线 员 接 听 电 话 
EREMU AM 
财务 主管 接听 电话 
电话 转 给 免费 账号 经 理 


表 15-6 


ARRETE 
连接 到 中 地 址 127.0.0.1 
建立 起 到 远程 主机 的 连接 
转 到 指定 端口 《9734) 
服务 器 从 select 调 用 返回 
服务 器 迹 用 accepr， 在 456 编 号 上 创建 新 的 套 接 字 


15.5 数据 报 


在 本 章 中 ， 我 们 重点 介绍 了 如 何 编号 与 客户 之 间 维 持 连 接 的 应 用 程 
序 。 我 们 用 面 问 连接 的 TCP 套 接 字 来 完成 这 一 工作 。 但 在 有 些 情 况 下 ， 
在 程序 中 花费 时 间 来 建立 和 维持 一 个 套 接 字 连接 是 不 必要 的 。 

早先 ， 我 们 在 程序 getdate.c 中 所 使 用 的 daytime 服 务 就 是 一 个 很 好 的 
例子 。 我 们 首先 创建 一 个 套 接 字 ， 然 后 建立 连接 ， 读 取 一 个 啊 应 ， 最 后 
Aa 在 这 一 过 程 中 ， 我 们 使 用 了 很 多 操作 步骤 ， 仅 仅 为 了 获取 一 
上 日 期 。 

daytime 服 务 还 可 以 用 数据 报 通 过 UDP 来 访问 。 为 了 访问 它 ， 发 送 
一 个 数据 报 给 该 服务 ， 然 后 在 啊 应 中 获取 一 个 包含 日 期 和 时 间 的 数据 
报 。 这 一 过 程 非 常 简单 。 

当 客 户 需 要 发 送 一 个 短小 的 查询 请 求 给 服务 器 ， 并 且 期 望 接收 到 一 
个 短小 的 啊 应 时 ， 我 们 一 般 束 使 用 由 UDP 提 供 的 服务 。 如 果 服 务 器 人 处理 
客户 请 求 的 时 间 足 够 短 ， 服 务 器 束 可 以 通过 一 次 处 理 一 个 客户 请 求 的 方 
式 来 提供 服务 ， 从 而 允许 操作 系统 将 客户 进入 的 请 求 放 入 队列 。 这 简化 
了 服务 器 程序 的 编写 。 

因为 UDP 提供 的 是 不 可 靠 服务 ， 所 以 你 可 能 发 现 数据 报 或 啊 应 会 丢 
失 。 如 果 数 据 对 于 你 来 说 非 党 重要， 就 需要 小 心 编 写 UDP 客 户 程序 ， 以 
ee 实际 上 ，UDP 数 据 报 在 局 域 网 中 是 非常 可 靠 


为 了 访问 由 UDP 提供 的 服务 ， 你 需要 像 以 前 一 样 使 用 套 接 字 和 close 
系统 调用 ， 但 你 需要 用 两 个 数据 报 专用 的 系统 调用 sendto 和 recvfrom 来 
代替 原来 使 用 在 套 接 字 上 的 read 和 write 调用 。 

下 面 是 一 个 修改 过 的 getdate.c 版 本 ， 它 通过 UDP 数据 报 服务 来 获取 
数据 。 对 先前 版 本 的 改动 将 以 阴影 显示 。 


如 你 所 见 ， 需 要 改动 的 地 方 非 常 少 。 像 以 前 一 样 ， 我 们 用 
getserVbyname 来 查找 daytime 服 务 ， 但 通过 请 求 UDP 协议 来 指定 数据 报 
服务 。 我 们 使 用 带 有 SOCK_DGRAM 人 参数 的 socket 调 用 来 创建 一 个 数据 
报 套 接 字 。 我 们 还 是 采用 与 以 前 一 样 的 方式 来 构建 目标 地 址 ， 但 现在 需 


要 发 送 一 个 数据 报 而 不 是 仅仅 从 套 接 字 上 读 取 数据 。 

因为 我 们 并 没有 明确 地 建立 一 条 到 指定 UDP 服务 的 连接 ， 所 以 必须 
用 某 些 方式 让 服务 器 知道 你 需要 接收 一 个 啊 应 。 在 本 例 中 ， 给 服务 器 发 
送 一 个 数据 报 〔( 在 这 里 ， 从 准备 接收 啊 应 的 缓存 区 中 发 送 一 个 字 节 的 数 
fa) ， 它 返回 包含 日 期 和 时 间 的 啊 应 。 

sendto 系 统 调用 从 buffer 绥 存 区 中 给 使 用 指定 套 接 字 地 址 的 目标 服务 
器 发 送 一 个 数据 报 。 它 的 原型 如 下 所 示 ; 


int sendto(int sockfd, void *buffer, size_t len, int flags, 
struct sockaddr *to, socklen_t tolen); 


在 正常 应 用 中 ，flags 参 数 一 般 被 设置 为 0。 
recvfrom 系 统 调用 在 套 接 字 上 等 待 从 特定 地 址 到 来 的 数据 报 ， 并 将 
它 放 入 buffer 缓 存 区 。 它 的 原型 如 下 所 示 : 


int recvfrom(int sockfd, void *buffer, size_t len, int flags, 
struct sockaddr *from, socklen_t *fromlen); 


同样 ， 在 正常 应 用 中 ，flags 参 数 一 般 被 设置 为 0。 
为 了 让 示例 程序 变 得 简短 ， 我 们 省 略 了 错误 处 理 。 当 错误 发 生 时 ， 
sendto 和 recvfrom 都 将 返回 -1 并 设置 errno。 可 能 的 错误 见 表 15-7。 


表 15-7 


eFFno 值 说 ER 


除非 用 fcnt1 将 套 接 字 设置 为 非 阻 塞 方式 〈 正 如 在 前 面 的 接受 TCP 连 
接 中 看 到 的 那样 ) ， 人 否则 recvfrom 调 用 将 一 直 阻 塞 。 我 们 可 以 用 与 前 面 
的 面向 连接 服务 器 一 样 的 方式 ， 通 过 select 调 用 和 超时 设置 来 判断 是 否 
有 数据 到 达 套 接 字 。 此 外 ， 还 可 以 用 alarm 时 钟 信 号 来 中 断 一 个 接收 操 
作 (参见 第 11 章 ) 。 


15.6 小结 


在 本 章 中 ， 我 们 介绍 了 另 一 种 进程 间 通 信 的 方法 : 套 接 字 。 通 过 它 
可 以 开发 出 真正 可 以 路 网 络 运行 的 分 布 式 客户 /服务 器 应 用 程序 。 我 们 
简要 介绍 了 一 些 主机 数据 库 信 息 函 数 以 及 Linux 是 如 何 使 用 因特网 守护 
进程 来 处 理 标准 系统 服务 的 。 我 们 开发 了 几 个 客户 /服务 器 示例 程序 来 
演示 网 络 和 多 客户 处 理 方法 。 

最 后 ， 我 们 介绍 了 select 系 统 调用 ， 它 允许 一 个 程序 同时 在 多 个 打 
开 的 文件 描述 符 和 套 接 字 上 等 待 输入 和 输出 活动 的 发 生 。 


所 原 书 的 说 明 似 有 误 ， 例 如 对 于 TCP 协 议 ， 我 们 可 以 将 level 参 数 设 置 为 
IPPROTO_TCP. ——i* #7 Vt 

所 原 书 似 有 误 ， 要 避免 出 现 僵尸 进程 ， 就 必须 在 服务 器 中 设置 
SIGCHLD 的 信号 处 理 函 数 。 一 -一 译 者 注 


在 本 书 前 面 的 部 分 中 ， 我 们 介绍 了 Linux 程 序 设 计 中 与 复 茶 的确 
层 问 题 相 关 的 主题 。 现 在 ， 我 们 将 为 应 用 程序 中 增添 一 些 活力 ， 介 绍 如 


何在 应 用 程序 中 加 入 图 形 用 户 界 面 (GUI) 。 在 本 章 和 下 一 章 中 ， 我 们 
将 介绍 Linux 中 两 个 最 受 欢迎 的 GUI 库 : GTK+ 和 KDE/Qt。 这 两 个 库 对 应 
两 个 最 受 欢 迎 的 Linux 桌 面 环境 : GNOME (GTK+) 和 KDE。 

Linux 中 所 有 的 GUI 库 都 其 于 被 称 作 X 视 窗 系 统 ( 更 常见 的 称呼 是 
X11 或 者 X)〉 的 底层 视窗 系统 。 因 此 ， 在 讲述 GNOME/GTK+ 的 具体 细节 
之 前 ， 我 们 将 首先 简要 介绍 X 视 窗 系统 是 如 何 运行 的 ， 并 帮助 读者 理解 
该 视窗 系统 的 不 同 层次 是 如 何 相 互 配 合 从 而 创建 桌面 的 。 

本 章 将 涵盖 以 下 内 容 : 

X 视 窗 系 统 

GNOME/GTK+ 简 介 

GTK+ 构 件 

GNOME 构 件 和 菜单 

对 话 框 

用 GNOME/GTK+ 编 写 CD 数 据 库 GUI 


OOOOdOd 


16.1 XI fat A on fat 


如 果 你 曾经 在 Linux 中 使 用 过 桌面 视窗 系统 ， 那 么 你 很 可 能 使 用 的 
是 X 一 一 一 个 开源 图 形 化 系统 。X 的 一 个 最 富有 创新 性 也 最 令 人 感到 洱 
丧 的 特征 ， 是 它 固守 机 制 的 要 求 ， 而 不 是 策略 的 需要 。 它 没有 定义 用 户 
界面 ， 但 提供 了 创建 用 户 界 面 的 手段 。 这 意味 着 你 可 以 自由 地 创建 自己 
的 整个 桌面 环境 ， 随 意 进 行 试验 和 创新 。 但 它 也 在 很 长 一 段 时 间 内 妨碍 
了 Linux 和 UNIX 系 统 上 用 户 界 面 的 发 展 。 在 这 一 片 相对 空白 的 领域 中 ， 
两 个 介面 项 目 逐 渐 浮 现成 为 Linux 用 户 的 最 爱 : GNOME 和 KDE。 然 而 ， 
Linux At ASX, HAA. HSE, Linux PA eT 
当 模 糊 的 东西 ， 并 没有 哪个 项 目 或 是 组 织 在 发 布 的 权威 版 本 。 当 前 主流 
的 安装 包含 了 大 量 的 库 、 工 具 和 应 用 程序 ， 它 们 被 总 称 为 “桌面 ”。 

X 拥 有 悠久 而 辉煌 的 历史 ， 它 最 初 于 20 世 纪 80 年 代 早 期 由 MIT 开 
发 。X 为 当时 的 高 端 科学 工作 站 提供 一 个 统一 的 视窗 系统 ， 那 些 工 作 站 
都 是 非常 昂贵 的 、 用 于 复杂 计算 的 庞然大物 。 

20 世 纪 90 年 代 ， 随 着 硬件 价格 的 下 降 ， 一 些 爱好 者 将 X 移 植 到 廉价 
的 家 用 PC 上 ， 这 个 项 目 后 来 被 称 为 XFree86 〈Intel 和 其 他 公司 生产 的 PC 
Ath FH AS A BR Ay 86 Mb EH as) 。 目 前 在 Linux 上 发 布 的 都 是 XFree86 的 衍生 
产品 ， 大 多 数 Linux 发 行 版 使 用 的 是 一 个 被 称 为 X.Org 的 X 变 体 。 

X 视 窗 系 统 被 分 为 硬件 级 和 应 用 程序 级 组 件 ， 它 们 分 别 被 称 为 X 服 
务 器 和 X 客 户 端 。 这 些 组 件 使 用 X 协 议 进行 通信 。 在 下 面 几 节 中 ， 我 们 
将 依次 介绍 它们 。 


16.1.1_X 服 务 器 


X 服 务 器 运行 在 用 户 的 本 地 机 器 上 ， 它 在 屏幕 上 完成 低层 的 绘图 操 
作 。 其 名 字 中 的 服务 器 部 分 经 常 让 人 困惑 : XARA aS IT EH R 
PC 上 ， 而 X 客 户 端 既 可 以 运行 在 用 户 的 果 面 PC 上 ， 也 可 以 运行 在 网 络 中 
的 其 他 系统 (包括 服务 器 〉 上 。 这 一 颠倒 的 术语 只 有 在 你 理解 它 时 才 有 
意义 ， 但 它 通常 看 上 去 有 点 反 其 道 而 行 之 的 感觉。 

因为 X 服 务 器 直接 与 显卡 交互 ， 所 以 你 必须 使 用 一 个 适合 本 机 显卡 
的 X 服 务 器 ， 并 配置 好 合适 的 分 辨 率 、 刷 新 率 、 颜 色 深 度 等 。 其 配置 文 
件 名 是 xorg.conf 或 者 Xfree86Config。 在 过 去 ， 你 通常 需要 手动 编辑 配置 
文件 才能 使 得 X 正 党 工作 。 科 和 运 的 是 ， 现 在 的 Linux 发 行 厂 可 以 上 自动 检测 
正确 的 设置 ， 这 节省 了 用 户 的 时 间 ， 也 解决 了 很 多 让 人 头疼 的 问题 。 

X 服 务 器 通过 鼠标 和 键盘 监听 用 户 输入 ， 并 将 键盘 按键 和 鼠标 点 击 


Feta XP sin I FEE o 这 些 信息 被 称 为 事件 (event) ， 它 们 构成 
GUI 编 程 的 一 个 关键 元 素 。 我 们 将 在 本 章 后 面 详细 介绍 事件 及 其 
GTK+ 人 逻辑 扩展 一 一 信号 (signal) 。 


16.1.2 X% vin 


X 客 户 端 是 以 X 视 窗 系 统 作 为 GUI 的 任何 程序 。 例 如 xterm、xcalc 和 
类 似 Abiword 的 更 高 级 的 应 用 程序 。 通 常情 况 下 ，X 客 户 端 等 候 X 服 务 器 
传送 的 用 户 事件 ， 然 后 通过 给 X 服 务 器 发 送 重 绘 消 息 来 啊 应 。 


X 客 户 剖 不 需要 和 X 服 务 占 运行 在 同一 台 机 絮 上 。 
16.1.3 XX 协议 


义 究 户 端 和 XX 服务 器 使 用 X 协 议 进 行 通信 ， 这 使 得 客户 端 和 服务 右 可 
以 通过 网 络 分 离 。 例 如 ， 你 可 以 在 因特网 或 者 加 密 的 虚拟 专用 网 
(VPN) 上 的 一 台 远 程 计 算 机 上 运行 X 客 户 端 应 用 程序 。 对 于 绝 大 多 数 
个 人 Linux 系 统 来 说 ，X 客 户 端 和 X 服 务 器 都 运行 在 同一 个 系统 上 。 


16.1.4 Xlib 库 


Xlib 是 XX 客户 端 间接 用 于 产生 X 协 议 消息 的 库 。 它 提供 一 个 非常 底 
层 的 API 供 客户 端 在 X 服 务 器 上 绘制 非常 基本 的 元 素 ， 并 响应 最 简单 的 
输入 。 我 们 必须 强调 ，Xlib 是 一 个 非常 底层 的 库 ， 即 使 使 用 Xlib 库 创建 
一 个 像 菜 单 这 样 非常 简单 的 东西 ， 也 要 耗费 程序 员 很 大 的 精力 ， 它 需要 
数 百 行 的 代码 。 

GUI 程序 员 不 应 该 直接 使 用 XIib 进 行 编程 。 你 需要 一 个 API 使 得 诸如 
菜单 、 按 钮 和 下 拉 式 列表 等 GUI 元 素 能 够 被 简单 方便 地 创建 。 简 而 言 
之 ， 这 就 是 X 工 具 包 的 作用 。 


16.1.5 X LAA 


X 工 具 包 是 一 个 GUI 库 ，X 客 户 端 可 以 利用 它 来 极 大 地 简化 窗口 、 
菜单 和 按钮 等 的 创建 。 使 用 工具 包 ， 你 通过 一 次 函数 调用 就 可 以 创建 按 
钮 、 沫 单 、 框 架 等 类 似 的 元 素 。 诸 如 此 类 的 GUI 元 素 被 统称 为 构件 
(widget) ， 你 在 所 有 的 现代 GUI 库 中 都 能 找到 这 个 通用 术语 。 

你 有 几 十 个 X 工 具 包 可 选 ， 每 个 工具 包 都 有 其 长 处 和 短处 。 选 择 哪 
个 包 对 于 应 用 程序 来 说 是 一 个 重要 的 设计 决定 ， 你 应 该 考虑 以 下 一 些 因 


O 应 用 程序 针对 的 用 户 是 谁 ? 

口 用 户 是 否 已 经 安装 好 了 工具 包 库 ? 

口 该 工具 包 是 否 文 持 其 他 流行 的 操作 系统 ? 

Oo 该 工具 包 使 用 什么 软件 许可 证 ， 该 许可 证 是 否 与 你 期 望 的 用 法 

一 致 ? 

口 “ 该 工具 包 是 否 支 持 你 的 编程 语言 ? 

口 该 工具 包 是 否 具 有 现代 的 界面 外 观 ? 

历史 上 最 流行 的 工具 包 有 Motif、OpenLook 和 Xt， 但 是 它们 大 多 已 
经 被 技术 上 更 先进 的 GTK+ 和 Qt 工具 包 所 取代 ， 这 两 者 分 别 构成 了 
GNOME 和 和 KDE 桌面 的 基础 。 


16.1.6 7 HO EHA 


Xtra E ao Sees, Chae lite ENO. 
OE EE a is CPN LEK, RHE TERR RIS, HERR 
可 以 交互 的 区 域 。 窗 口 管理 器 还 负责 装饰 每 个 窗口 ， 通 常 这 些 闭 饰 由 一 
个 框架 和 一 个 带 有 最 大 化 、 最 小 化 和 关闭 图 标的 标题 栏 组 成 。 窗 口 管理 
器 提供 了 更 面 的 部 分 界面 外 观 ， 例 如 窗口 标题 栏 。 

和 常见 的 窗口 管理 右 包 括 下 面 几 个 。 

O Metacity: GNOMER MHIAN B O E AS o 

O KWin: KDE HAIAN Bi OE Hao 

O Openbox: 旨 在 节约 资源 ， 用 于 较 老 的 、 较 慢 的 系统 。 

O Enlightenment: 一 个 有 着 出 色 图 形 和 效果 的 窗口 管理 占 。 

就 和 X 中 的 一 切 一 样 ， 你 也 可 以 切换 窗口 管理 器 。 但 大 多 数 用 户 都 
使 用 昌 面 环境 上 自 带 的 窗口 管理 器 。 


其 他 一 些 不 是 特定 于 Linux 的 创建 GUI 的 方法 也 是 值得 一 提 的 。 有 些 
语言 本 身 就 支持 GUI， 并 且 可 以 在 Linux 下 使 用 。 

O Java 语 言 使 用 Swing 和 较 老 的 AWT ”API 来 支持 创建 GUI。Java 

GUI 的 界面 外 观 并 不 是 所 有 人 都 喜欢 ， 而 且 在 配置 低 的 机 器 上 ， 它 

的 界面 感觉 比较 策 抄 ， 而 且 响 应 迟钝 。 使 用 Java 的 一 大 好 处 是 ， 编 

译 好 的 Java 代 码 可 以 在 任何 具有 Java 虚 拟 机 的 平台 (包括 Linux、 

Windows. Mac OS 以 及 移动 设备 ) 上 运行 而 无 需 任何 改动 。 更 多 信 


恩 请 访问 http://java.sun.com。 


口 “C# 是 一 个 与 Java 非 常 类 似 的 编程 语言 。Linux 系 统 需要 安装 来 自 

Mono 项 目 Chttp://www.mono-project.com) 的 C# 公 共 语 言 运 行 时 环 

$i (CLR) 。Mono 平 台 上 的 C# 还 文 持 Windows Forms 〈 它 也 在 

Windows HF EH) ， 以 及 一 个 被 称 为 Gtk# 的 对 GTK+ 工 具 包 的 特殊 

绑 定 。 

O TcyTIk 是 一 个 脚本 语言 ， 它 非常 适 于 快速 开 及 GUI， 并 文 持 X、 

Windows 和 Mac OS。 当 需要 快速 原型 开发 ， 或 开发 一 些小 工具 《和 需 

要 脚本 的 简单 性 和 可 维护 性 ) 时 ，TcwTk 非 常 棒 。 有 关 该 语言 的 更 

详细 资料 请 见 http://td.tk。 

O Python 也 是 一 个 脚本 语言 。 你 可 以 在 Python 中 使 用 TcyTk 的 Tk 部 

分 ， 或 使 用 Python 的 GTK+ 绑 定 来 编写 GTK+ 程 序 。 有 关 该 语言 的 更 

多 资料 请 见 http://www.python.org。 

口 、Perl 是 男 一 个 常见 的 Linux 脚 本 语言 。 你 可 以 在 Perl 中 使 用 Tc/Tk 

的 Tk 部 分 ， 这 被 称 为 Perl/Tk。 有 关 Perl 的 更 多 资料 请 见 

http:/www.perl.org/。 

这 些 语言 带 来 的 平台 无 关 特性 是 需要 付出 代价 的 。 与 本 地 应 用 程序 
之 间 共 享 信息 (例如 使 用 “ 拖 放 ”技术 ) 会 比较 困难 ， 而 且 保 存 配置 通常 
必须 使 用 专用 方法 而 非 人 桌面 标准 方法 。 有 时 Java 软 件 的 销售 商 通 过 附带 
平台 相关 的 扩展 来 回避 这 些 问 题 。 


16.2 GTK+} 


了 解 了 X 视 窗 系统 之 后 ， 下 面 我 们 该 介绍 GTK+ 工 具 包 了 。GTK+ 一 
开始 是 作为 流行 的 GNU 图 像 处 理 程序 GIMP 的 一 部 分 产生 的 ， 这 也 是 
GTK 得 名 的 原因 (Gimp ToolKit 的 缩写 ) 。 因 为 GTK+ 己 经 发 展 并 逐渐 
成 为 功能 最 强大 和 最 受 欢迎 的 工具 包 之 一 ， 所 以 GIMP 程 序 设计 者 颇 有 
远见 地 将 GTK+ 变 为 一 个 独立 的 项 目 。GTK+ 项 目的 主页 是 
http://www. gtk.org - 


简 而 言 之 ，GTK+ 是 一 个 函数 库 ， 它 提供 了 一 组 已 制作 好 的 被 
称 为 构件 的 组 件 。 你 通过 简单 易 用 的 函数 调用 把 这 些 组 件 和 应 用 程 
序 罗 和 辑 组 合 在 一 起 ， 从 而 极 大 地 简化 了 GUI 的 创建 。 


尽管 GTK+ 是 一 个 与 GIMP 一 样 的 GNU 项 目 ， 但 是 它 使 用 的 是 更 目 
由 的 LGPL 许 可 证 (Lesser GeneralPublic License) 。LGPEL 人 允许 人 们 使 用 
GTK+ 来 编写 软件 〈 包 括 源 代 码 不 开放 的 私有 软件 ) 而 不 用 文 付 任何 使 
用 费 、 版 税 及 受到 其 他 限制 。GTK+ 许 可 证 所 提供 的 自由 度 与 它 的 竞争 
者 Qt〈 下 一 章 的 主题 ) 恰 成 对 比 ， 后 者 的 GPL 许可 证 茶 止 使 用 Qt 开发 丙 
业 软 件 〈 你 必须 购买 一 个 商业 Qt 许可 证 ) 。 

GTK+ 完 全 是 用 C 语 言 编写 的 ， 而 且 绝 大 多 数 GTK+ 软 件 也 是 用 C 语 
言 编写 的 。 但 笠 运 的 是 ， 有 许多 语言 绑 定 使 你 可 以 在 自己 偏好 的 语言 中 
使 用 GTK+， 这 些 语言 包括 C++、Python、PHP、Ruby、Perl、C# 和 
Java. 

GTK+ 本 里 是 建立 在 一 组 其 他 水 数 库 之 上 的 ， 如 下 所 示 。 

a 提供 底层 数据 结构 、 类 型 、 线 程 支持 、 事 件 循 环 和 动态 

MEX o 
O GObject: 使 用 C 语 言 而 不 是 C++ 语言 实现 了 一 个 面向 对 象 系 
统 


O Pango: 文 持 文本 演 染 和 布局 。 

口 ATK: 用 来 创建 可 访问 应 用 程序 ， 并 人 允许 用 户 使 用 屏幕 阅读 器 
和 其 他 协助 工具 来 运行 你 的 应 用 程序 。 

O GDK (GIMP 绘 图 工具 包 ) : 在 Xlib 之 上 处 理 底层 图 形 演 染 。 
O GdkPixbuf: 在 GTK+ 程 序 中 帮助 处 理 图 像 。 

oO Xlib: 在 Linux 和 UNIX 系 统 上 提供 底层 图 形 。 


16.2.1 GLib 类 型 系 


如 果 你 阅读 过 GTK+ 代 码 ， 你 可 能 会 很 奇怪 为 什么 代码 中 有 许多 以 
字母 g 开 头 的 C 语 言 数据 类 型 ， 如 gint、gchar、gshort， 还 有 一 些 像 gint32 
和 gpointer 这 样 不 熟悉 的 类 型 。 这 是 因为 GTK+ 建 立 在 一 个 可 移植 的 C 语 
言 库 Glib 和 GObject 之 上 ， 它 们 定义 了 这 些 类 型 来 实现 跨 平台 开发 。 

Glib 和 GObject 提 供 了 一 组 数据 类 型 、 函 数 和 宏 的 标准 蔡 代 集 来 进行 
内 存 管理 和 处 理 常 见 任 务 ， 从 而 实现 跨 平台 开发 。 这 些 数据 类 型 、 函 数 
和 宏 意味 着 作为 GTK+ 程 序 员 ， 我 们 可 以 确信 我 们 的 代码 能 可 靠 地 移植 
到 其 他 平台 和 体系 结构 上 。 

Glib 还 定义 了 一 些 方便 的 常量 : 

#include <glib/gmacros.h> 


#define FALSE 0 
#define TRUE !FALSE 


1 EE A TT A CHS EAN EE ECTS BS BERN AR CA — 
致 性 和 可 读 性 ) ， 以 及 用 于 确保 跨 平 台 字 市 长 度 不 变 。 

O gint, guint、gchar、guchar、glong、gulong、gfloat 和 和 gdouble 是 

标准 C 语 言 数 据 类 型 的 简单 蔡 代 【为 一 致 性 考虑 ) 。 

O gpointer5 (void *) 同 义 。 

O gboolean 用 于 表示 布尔 类 型 的 值 ， 它 是 对 int 的 一 个 包装 。 

O gint8、guint8、gintl6、guintl6、gint32 和 guint32 是 保证 字 节 长 度 

的 有 符号 和 无 符号 类 型 。 

使 用 Glib 和 GObject 几 乎 是 透明 的 ， 这 一 点 很 有 用 。Glib 在 GTK+ 中 
被 广泛 地 使 用 ， 因 此 ， 如 果 你 有 一 个 可 以 正常 工作 的 GTK+， 你 将 发 现 
GLib 也 被 安装 了 。 在 使 用 GTK+ 编 程 时 ， 你 甚至 不 需要 明确 地 包含 头 文 
件 glib.h， 这 一 点 你 将 在 本 章 后 面 看 到 。 


16.2.2 GTK+ RAA 


编 过 GUI 程 序 的 人 都 能 理解 ， 我 们 为 什么 说 GUI 库 非常 适合 于 使 用 
面向 对 象 编程 的 范 型 ， 以 至 于 所 有 的 现代 工具 包 (包括 GTK+) 都 是 以 
一 种 面向 对 象 的 风格 编写 的 。 

尽管 GTK+ 是 完全 用 C 语 言 编写 的 ， 但 是 它 通 过 GObject 库 支持 对 象 
和 面向 对 象 编程 。 这 个 库 通 过 宏 来 支持 对 象 继 承 和 多 态 。 

让 我 们 看 一 个 继承 和 多 态 的 例子 ， 它 取 目 GTK+API 文 档 中 的 
GtkWindow 的 对 象 层次 结构 : 


这 个 对 象 列 表 表 明 GtkWindow 是 GtkBin 的 一 个 子 类 ， 因 此 所 有 带 
GtkBin 参 数 的 函数 在 调用 时 都 可 以 带 GtkWindow 参 数 。 同 样 地 ，GtkBin 
继承 自 GtkContainer， 而 后 者 继承 自 GtkWidget。 

r 为 方便 起 见 ， 所 有 构件 创建 函数 都 返回 一 个 GtkWidget 的 类 型 。 例 
H: 


GtkWidget* gtk_window_new (GtkWindowType type); 
假设 你 创建 了 一 个 GtkWindow， 并 想 把 返回 值 传 给 某 个 需要 以 
GtkContainer 作 为 参数 的 函数 (如 gtk_container_add) : 
void gtk container add (GtkContainer *container, GtkWidget *widget); 
你 需要 使 用 宏 GTK_CONTAINER 在 GtkWidget 和 GtkContainer 之 间 
UAT AAR: 


ew(GTK GTK_WINDOW_TOPLEVEL 


So 现在 你 只 需 知道 宏 是 经 常 被 使 用 的 ， 
一 种 可 能 的 类 型 转换 都 有 对 应 的 宏 存 在 。 


如 果 你 还 不 是 很 清楚 ， 请 不 要 担心 。 掌 握 GNOME/GTK+ 并 不 
要 你 理解 面 癌 对 象 编程 的 所 有 细节 。 事 实 上 ， 利 用 C 语 言 的 知识 
:轻松 学 习 面 癌 对 象 编程 思想 和 其 优点 。 


16.2.3 ”GNOME 位 介 


GNOME 是 一 项 1997 年 启动 的 项 目的 名 称 ， 该 项 目 由 GIMP 程 序 员 发 
起 ， 目 标 是 为 Linux 创 建 一 个 统一 的 桌面 。 人 们 有 一 个 普遍 的 共识 : 缺 
乏 一 个 一 致 的 策略 阻碍 了 Linux 用 作 桌 面 平台 的 进程 。 那 时 ，Linux 桌 面 
就 像 拓 葛 前 的 美国 西部 一 样 ， 没 有 整体 的 标准 和 约定 的 做 法 ， 却 有 “无 
所 不 为 ”的 程序 员 精 神 。 由 于 没有 一 个 权威 组 织 对 桌面 菜单 、 一 致 的 界 
面 外 观 、 文 档 、 翻 译 等 进行 控制 ， 所 以 说 好 昕 点， Linux 桌面 的 新 手 会 
感到 很 迷惑 ， 说 难听 点 ， 这 样 的 桌面 根本 无 法 使 用 。 

GNOME 团 队 着 手 创 建 一 个 完全 遵循 GPL 许可 证 的 Linux 桌 面 ， 用 统 
一 和 一 致 的 风格 来 开发 工具 和 配置 程序 ， 间 通 信 、 打 印 、 
会 话 管理 、GUI 程 序 设 计 最 佳 实践 等 方面 标准 的 制定 


他 们 努力 的 结果 是 显而易见 的 一 一 现在 GNOME 已 成 为 Fedora、Red 
Hat, Ubuntu 以 及 openSUSE 等 发 行 版 的 默认 Linux 曙 面 的 基础 〈 见 图 16- 
1) 。 
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图 16-1 


GNOME 最 初代 表 的 是 GNU Network Object Model Environment 
(GNU 网 络 对 象 模 型 环境 ) ， 这 反映 了 GNOME 早 期 的 一 个 目标 ， 即 为 
Linux 引 入 一 个 像 Microsoft ”OLE& 一 样 的 对 象 框架 ， 这 样 你 就 可 以 在 字 
处 理 文 档 中 藤 入 电子 表格 了 。 现 在 ，GNOME 的 设计 目标 发 生 了 变化 ， 
我 们 所 知道 的 GNOME 指 的 是 整个 果 面 环境 ， 它 包括 一 个 启动 应 用 程序 
的 面板 、 一 套 程序 和 实用 工具 、 编 程 库 以 及 开发 者 支持 特性 。 

在 开始 编程 之 前 ， 你 需要 确认 所 有 库 都 已 安装 好 。 


16.2.4 ”安装 GNOME/GTK+ 开 发 


一 个 带 有 标准 应 用 程序 和 GNOME/GTK+ 开 发 库 的 完整 GNOME 桌 
面包 括 60 多 个 软件 包 。 因 此 ， 从 头 安 装 GNOME ,无论 是 手工 安装 还 是 从 
源 代 码 安 装 ， 都 是 一 个 令 人 明 惧 的 过 程 。 幸 运 的 是 ， 现 代 Linux 发 行 版 
都 有 很 优秀 的 软件 包 管 理工 具 ， 它 使 得 安装 GNOME/GTK+ 及 其 开发 库 
变 得 轻而易举 。 

在 Red Hat 与 Fedora Linux 中 ， 你 通过 点 击 应 用 程序 菜单 按钮 〈 在 左 
上 角 ) ,并 选择 Add/Remove Software (增加 /删除 软件 ) 来 打开 软件 包 管 
理工 具 。 软 件 包 管 理工 具 打 开 后 〈 见 图 16-2) ,请 确认 GNOME Software 


Development 


Development (F) KIRF. 


CGNOME 软 件 开 发 ) 检查 框 被 选中 。 它 在 


本 章 中 ， 你 将 使 用 GNOME/GTK+2， 因 此 请 确认 你 安装 了 2.x 


版 本 的 库 。 
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APE AL RPM ELIS ATT WOR, Wee eee F RPM Eh: 


gtk2-2.10.11-7.f£c7.rpm 
gtk2-devel-2.10.11-7.fc7.rpm 
gtk2-engines-2.10.0-3.fc7.rpm 
libgnome-2.18.0-4.fc7.rpm 
libgnomeui-2.18.1-2.fc7.rpm 
libgnome-devel-2.18.0-4.£c7.rpm 
libgnomeui-devel-2.18.1-2.fc7.rpm 


在 本 例 中 ， 文 件 名 中 的 fc7 指 的 是 Fedora 7 Linux 发 行 版 。 你 的 系统 


显示 的 名 字 可 能 稍微 不 同 。 


在 Debian 或 基于 Debian 的 系统 (如 Ubuntu)〉 中 ， 你 可 以 使 用 apt-get 


命令 从 各 种 镜像 站 点 中 安装 GNOME/GTK+。 更 多 细节 请 访问 
http:/www.gnome.org。 

另外 ， 你 也 可 以 尝试 运行 一 下 GTK+ 的 演示 程序 ， 它 们 展示 了 所 有 
构件 的 外 观 《〈 见 图 16-3) : 


$ gtk-demo 


t GTK+ Code Demos = Ox 
Widget (doubie ciek for demo) | jnfo |Source 


Appacation man window Drawing Area 


人 GOtkDrawingArea is a blank area where you Can craw 
Hutton Bowes (custom displays of various kinds. 
Change Otsplay [This demo has two drawing areas. The checkerboard 


area shows how you can just draw something: af you 
Clipboard have to do is write a signal handler for expose_event 
Color Selector as shown here 


he “scribble” area is a bit more advanced, and shows 
thow to handie events such as button presses and 
Dialog and Message Boxes = nouse motion. Click the mouse and drag in the 

= Ss scribble ares to draw squiggles. Resize the window to 
PCs the aea 


Combo boxes 


Swing A 2 
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图 16-3 


对 每 个 构件 ， 你 都 可 以 看 到 一 个 Info 标 签 和 一 个 Source 标 签 。 后 者 
显示 了 使 用 指定 构件 的 实际 C 语 言 源 代码 。 这 里 提供 了 大 量 的 示例 。 
K 验 一 个 空白 的 GtkWindow 

让 我 们 以 一 个 最 简单 的 GUI 程序 来 开始 GTK+ 编 程 吧 , 它 用 于 显示 一 
个 窗口 。 你 将 看 到 GTK+ 库 的 实际 使 用 情况 ， 并 看 到 你 可 以 从 很 少 的 代 
人 码 中 获得 多 少 功能 。 


(1) 输入 程序 的 代码 ,并 把 它 保 存 为 gtkl.c: 
kWidge d 


(2) 为 编译 gtk1.c, 请 输入 : 
$ gcc gtk1.c-o gtk1 pkg-config --cflags --libs gtk+-2.0 
注意 ,输入 的 是 反 引 号 ， 而 不 是 单 引 号 。 请 记 住 反 引号 是 要 求 shell 执 
行 其 包含 的 命令 并 将 输出 结果 附加 其 后 。 
当 使 用 以 下 命令 来 运行 这 个 程序 时 ， 你 的 窗口 将 会 弹出 〈 见 图 16- 


4) : 


图 16-4 


注意 ， 你 可 以 对 这 个 窗口 进行 移动 、 调 整 大 小 、 最 小 化 和 最 大 化 。 
你 用 一 条 语句 #include ”<gtk/gtk.h> 来 包含 必需 的 GTK+ 库 和 相关 库 
(包括 Glib) 的 头 文 件 。 接 着 ， 你 声明 窗口 为 一 个 指向 GtkWidget 的 指 


针 。 

为 了 初始 化 GTK+ 库 ， 你 必须 调用 gtk_init 函 数 ， 将 命令 行 参 数 argc 
和 argv 传 递 给 它 。 这 给 了 GTK+ 一 个 机 会 来 解析 它 需 要 知道 的 任何 命令 
行 参数 。 注 意 : 你 必须 在 调用 任何 GTK+ 函 数 之 前 对 其 进行 这 样 的 初始 
£ 


这 个 例子 的 核心 代码 是 对 gtk_window_new 的 调用 ,其 函数 原型 是 : 
GtkWidget*gtk_window_new (GtkWindowType type); 
参数 type 根 据 窗口 的 目的 可 取 下 面 两 个 值 之 一 。 


口 GTK_WINDOW_TOPLEVEL: 一 个 标准 的 有 框架 窗口 。 

口 GTK_WINDOW_POPUP: 一 个 适用 于 对 话 框 的 无 框架 窗口 。 

你 几乎 总 是 使 用 GTK_WINDOW_TOPLEVEL， 因 为 你 将 在 后 面 看 
到 ， 还 有 更 方便 的 创建 对 话 框 的 方法 。 

gtk_window_new 调 用 在 内 存 中 建立 窗口 ， 使 得 在 将 窗口 实际 显示 在 
屏幕 之 前 ， 你 可 以 在 它 里 面 放置 构件 ， 调 整 它 的 大 小 ， 改 变 窗 口 的 标题 
等 。 要 实际 显示 窗口 ， 你 需要 调用 gtk_widget_show:gtk_widget_show 
(window) 

该 函数 只 需要 一 个 GtkWidget 指 针 ， 因 此 你 只 需 把 窗口 的 引用 传 给 
Es 

你 最 后 调用 的 函数 是 gtk_main。 这 个 关键 函数 通过 把 控制 权 交 给 
GTK+ 来 局 动 交 互 过 程 ， 并 且 一 直 运 行 ， 直 到 调用 gtk_main_quit 才 返 
回 。 正 如 你 所 看 到 的 ，gtkl.c 并 未 调用 gtk_main_quit 因 此 ， 即 使 窗口 被 
关闭 ， 程 序 也 不 会 停止 。 你 可 以 试 着 点 击 关 闭 图 标 ， 你 将 看 到 并 没有 返 
回 命令 提示 符 。 我 们 将 在 下 一 节 学 过 信号 和 回调 函数 之 后 再 来 纠正 这 个 
错误 。 至 于 现在 ， 你 可 以 在 启动 gtkl 程 序 的 shell 窗 口中 按 下 Ctrl+C 组 合 
键 来 退出 这 个 程序 。 


所 有 的 GUI 库 都 有 一 个 共同 点 : 必须 存在 某 种 机 制 来 响应 用 户 动作 
并 执行 相应 代码 。 一 个 命令 行程 序 的 奢侈 做 法 是 暂停 执行 ， 等 待 用户 输 
入 ， 然 后 采用 switch 语 句 等 方法 让 程序 根据 输入 进行 分 文 执 行 。 但 这 种 
方法 并 不 适用 于 GUI 应 用 程序 ， 因 为 应 用 程序 必须 不 断 啊 应 用 户 输入 ， 
例如 ， 它 需要 不 断 更 新 窗口 区 域 。 

现代 窗口 系统 用 事件 和 事件 监听 器 系统 来 解决 这 个 问题 。 其 思想 
是 ， 每 次 用 户 输入 《通常 是 通过 鼠标 或 是 键盘 ) 都 触发 一 个 事件 。 例 
如 ， 一 次 击 键 会 触发 一 个 键盘 事件 。 因 此 ， 程 序 员 需 要 编写 监听 这 些 事 
件 的 代码 ， 以 及 当 事 件 被 触发 时 要 执行 的 代码 。 

正如 你 前 面 所 看 到 的 ，X 视 窗 系统 会 发 出 这 些 事 件 ， 但 是 它们 对 
GTK+ 程 序 员 并 没有 太 大 帮助 ， 因 为 它们 都 是 非常 底层 的 。 当 鼠标 按钮 
被 点 击 时 ，X 发 出 一 个 包含 鼠标 指针 坐标 的 事件 ， 而 你 真正 需要 知道 的 
是 用 户 何 时 激活 了 一 个 构件 。 

因此 ，GTK+ 有 它 上 自己 的 事件 和 事件 监听 器 系统 ， 它 们 被 称 为 信和 号 
和 回调 函数 。 它 们 非常 容易 使 用 ， 因 为 你 可 以 使 用 C 语 言 的 一 个 非常 有 
用 的 特征 一 一 函数 指针 来 设置 信号 处 理 器 。 

先 看 一 些 定义 : GTK+ 信 号 是 当 某 件 事 〈 如 用 户 输入 ) 发 生 时 ， 由 
GtkObject 对 象 发 出 的 。 一 个 与 信号 相连 接 ， 并 且 一 旦 当 信 号 被 发 出 ， 它 
就 会 被 调用 的 函数 补 称 为 回调 函数 。 
注意 ，GTK+ 信 号 与 第 11 半 中 讨论 的 UNIX 信 号 无 关 。 

作为 一 个 GTK+ 程 序 员 ， 你 需要 关心 的 就 是 ， 如 何 编写 和 连接 回调 
函数 ， 因 为 发 出 信号 的 代码 是 内 置 在 特定 构件 中 的 。 

回调 函数 的 原型 通常 如 下 所 示 : 

void a_callback_function (GtkWidget *widget,gpointer user_data); 

其 中 传递 了 两 个 参数 : 第 一 个 参数 是 指向 发 出 信号 的 构件 的 指针 ， 
第 二 个 参数 是 当 你 连接 回调 函数 时 自己 选择 的 一 个 任意 指针 。 你 可 将 该 
旨 针 用 于 任何 目的 。 

连接 回调 函数 同样 简单 。 你 只 需 调用 g_signal_connect, 并 传递 如 下 
《作为 字符 串 ) 、 回 调 函 数 指针 和 你 的 任意 
日 


gulong 9_signal_connect (gpointer *object, const gchar *name, GCallback func, 
gpointer vser data ); 


有 一 点 值得 指出 : 连接 回调 函数 没有 任何 限制 。 你 可 以 将 多 个 信和 号 
连接 到 同一 个 回调 函数 ， 也 可 以 将 多 个 回调 函数 连接 到 同一 个 信号 。 有 


关 每 个 构件 发 出 的 信号 的 详细 资料 请 参阅 GTK+API 文 档 。 


在 GTK+2 之 前 的 版 本 中 ， 用 于 连接 回调 函数 的 函数 是 
gtk_signal_connect, 该 函数 已 被 g_signal_connect 取 代 ， 你 在 新 的 代码 
中 不 应 再 使 用 该 函数 。 


在 下 一 个 例子 中 ， 我 们 将 使 用 函数 g_signal_connect。 


实 验 回调 函数 
在 gtk2.c 中 ， 你 将 在 窗口 中 添加 一 个 按钮 ， 并 将 这 个 按钮 
的 “cicked” 信 号 与 回调 函数 连接 ， 从 而 显示 一 条 短信 息 : 
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上 ir gpo 
pressed %d tim 
wi 
kWiage 
rgc kargv) ; 
k_window_new (GT NX El 
b butto ew labe H 
gtx_con ne Gd (¢ T. IER (w u 
J (GTK OBJECT 
GTX_SIGNAL_FUN 
stton 1*) 
gt J ! 
gt 
gtk_ma 


输入 这 个 程序 的 源 代 码 并 将 它 保存 为 gtk2.c。 使 用 与 前 面 gtkl.c 示 例 
类 似 的 命令 编译 和 链接 这 个 程序 。 当 运行 这 个 程序 时 ， 你 将 看 到 一 个 带 
按钮 的 窗口 ， 每 次 当 你 点 击 这 个 按钮 时 ， 它 都 会 输出 一 条 短 消 轧 〈 见 图 
16-5) 。 


@ ericti@kxayak:/home2/erictjswriting/Beginning Linux Programming 4th Edje ~ O'X 
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{ericfj@kayak eric src]$ ./gtk2 
Button 1 pressed 1 time(s) 
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iig 图 16-5 = 
gtk2.c 的 代码 中 引入 了 两 个 新 特性 : GtkButton 和 回调 函数 。 
GtkButton 是 一 个 简单 的 按钮 构件 ， 它 可 以 包含 文本 《在 本 例 中 ， 它 包 
含 的 文本 是 “Hello World”) ,并 在 鼠标 点 击 这 个 按钮 时 发 出 被 称 


为 “dicked” 的 信和 号 
回调 函数 button_clicked 通 过 g_signal_connect 函 数 连接 到 按钮 构件 
的 “clicked” 信 号 
g_signal_connect (GTK_OBJECT (app), "clicked’ 
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注意 ， 按 钮 的 名 称 Btton 1 作为 用 户 数 据 传递 给 回调 函数 。 
代码 的 其 他 部 分 处 理 按 钮 构件 ， 它 的 创建 方法 与 窗口 类 似 ， 调 用 
gtk_button_new_with_label 函 数 ， 然 后 用 gtk_widget_show 使 其 可 见 。 
通过 调用 gtk_container_add 函 数 将 按钮 放置 到 窗口 上 。 这 个 简单 的 
函数 将 一 个 GtkWidget 放 到 一 个 GtkContainer 中 ， 并 以 容器 和 构件 作为 参 
Ble 
voic K_container_add (GtkContainer *container, GtkWidget *widget) 
正如 你 :之 前 看 到 的 ，GtkWindow 是 GtkContainer 的 一 个 子 美 因此 
你 可 以 通过 GKT_CONTAINER 宏 将 窗口 对 象 转换 为 GtkContainer 类 型 ， 
gtk_container_add(GTK_CONTAINER (window), button); 


通过 gtk_container_add 辣 一 个 容器 里 放置 一 个 构件 是 很 方便 的 ， 但 


更 多 的 情况 是 ， 你 需要 在 一 个 窗口 的 不 同位 置 放置 好 几 个 构件 以 创建 一 
个 像样 的 外 观 。GTK+ 有 专用 于 此 目的 的 构件 一 一 盒 (box) 或 者 容器 


(container) 。 


16.4 HI RTE 


GUI 的 布局 对 其 可 用 性 来 说 至 关 重 要 ， 同 样 也 是 最 难 做 好 的 事情 之 
一 。 排 列 构件 的 真正 困难 在 于 ， 你 不 能 指望 所 有 用 户 都 有 相同 的 屏幕 分 
辩 紊 ， 或 有 相同 的 窗口 大 小 、 主 题 、 字 体 、 颜 色 方 案 。 在 一 个 系统 中 令 
人 满意 的 界面 在 另 一 个 系统 中 却 可 能 无 法 显示 。 

为 创建 一 个 在 所 有 系统 中 都 保持 一 致 的 GUL 你 要 避免 使 用 绝对 坐标 
来 放置 构件 ， 而 是 采用 一 种 更 灵活 的 布局 系统 。GTK+ 通 过 容器 构件 来 
实现 这 一 目标 。 它 可 以 用 来 在 应 用 程序 窗口 中 控制 构件 的 布局 。 盒 构件 
是 一 个 非常 有 用 的 容器 构件 类 型 。GTK+ 还 提供 了 许多 其 他 类 型 的 容器 
构件 ,它们 在 GTK+ 的 在 线 文 档 中 都 有 介绍 。 

盒 是 一 个 不 可 见 的 构件 ， 它 的 工作 束 是 包含 其 他 的 构件 ， 并 控制 它 
们 的 布局 。 为 了 控制 盒 中 每 个 构件 的 大 小 ， 你 为 它们 指定 规则 而 不 是 坐 
标 。 既 然 盒 构件 可 以 包含 任何 GtkWidget, 而 GtkBox 本 身 就 是 一 个 
GtkWidget, {KPI A REREKAI E R R AIA jE o 

GtkBox 有 下 面 两 个 主要 的 子 类 。 

口 _GtkHBox 是 一 个 单行 的 横 回 组 闭合 构件 。 

O GtkVBox 是 一 个 单列 的 纵向 组 装 盒 构 件 。 

在 创建 组 装 盒 时 ， 你 需要 指定 两 个 参数 (homogeneous 和 spacing) : 
GtkWidget* gtk_hbox_new (gboolean homogeneous, gint spacing); 

GtkWidget* gtk vbox new (gboolean homogeneous, gint spacing); 


这 些 参 数控 制 特 定 组 装 盒 中 所 有 构件 的 布局 。homogeneous 是 一 个 
布尔 值 ， 如 果 它 被 设 为 TRUE, 则 强制 盒 中 的 每 个 构件 都 占据 相同 大 小 的 
空间 ， 而 不 管 每 个 构件 的 大 小 。Spacing 以 像素 为 单位 设置 构件 间 的 间 


距 O 
一 旦 创建 好 组 装 盒 之 后 ， 你 就 可 以 用 gtk_box_pack_start 和 
gtk_box_pack_end 函 数 来 添加 构件 了 : 
void gtk box pack start (GtkBox *box, GtkWidget *child, 


gboolean expand, gboolean fill, 
guint padding); 


void gtk box pack end (GtkBox *box, GtkWidget *child, 
gboolean expand, gboolean fill, 
guint padding); 


gtk_box_pack_start 同 GtkHbox 的 右边 和 GtkVbox 的 底部 增加 构件 ， 
而 gtk_box_pack_end 则 向 ”GtkHbox 的 左边 和 GtkVbox 的 顶部 增加 构件 。 
它们 的 参数 控制 组 装 盒 中 每 个 构件 的 间距 和 格式 ， 

表 16-1 描 述 了 可 以 传递 给 gtk_box_pack_start 或 gtk_box_pack_end 的 


6 Q 说 虹 
ex 将 被 填充 的 组 装 1 
` ik A Leak 
fe) HE Hy WLS CEA ce SIR RS he eR PT SF ts AT Od d 
如 全 为 TRUE， 则 这 个 构件 将 填 谎 分 配给 它 的 空 介 ， 而 不 是 将 它 作为 国 绕 它 的 边 靖 填充 
参数 只 有 在 六 ane 
put 说 在 pty ot Ae 图 的 以 像素 hy 和 填充 


现 在 让 我 们 来 看 看 这 些 组 装 僵 构件 并 创建 一 个 更 复杂 的 用 户 界 面 


来 展示 组 装 盒 的 租 套 使 用 。 


实 验 构件 容器 的 布局 


在 本 例 中 ， 我 们 使 用 GtkHbox 和 GtkVBox 来 排列 一 些 简 
GtkLabel 构 件 。 标 签 是 一 种 简单 的 构件 , 它 用 于 显示 少量 的 文本 . 


序 名 为 container.c。 


#include <gtk/gtk.h> 


void closeApp ({ GtkWidget *window, gpointer data 
{ 

gtk_main_quit(); 
) 


/* Callback allows the application to cancel 


a close/destroy event. (Return TRUE to cancel.) * 


gboolean delete_event (GtkWidget ‘widget, GdkEvent * 


{ 
printf(*In delete_event\n*); 
return FALSE; 

} 

char *argv[) 


int main (int argc, 


{ 


Hy APL 的 


这 个 程 


GtkWidget “window; 

GtkWidget *labell, *label2, *label3; 
GtkWidget *hbox; 

GtkWidget *vbox; 


gtk_init(éarge, &argv); 
window = gtk_window_new(GTK_WINDOW_TOPLEVEL) ; 


gtk_window_set_title(GIK_WINDOW (window), "The Window Title’); 
gtk_window_set_position (GTK_WINDOW (window), GTK_WIN_POS_CENTER) ; 
gtk_window_set_default_size(GTK_WINDOW/{window), 300, 200); 


g_signal_connect ( GTK_OBJECT (window), "destroy", 
GTK_SIGNAL_PUNC ( closeApp), NULL); 


g_signal_connect ( GTK_OBJECT (window), “delete_ event", 


GTK_SIGNAL_PUNC | delete_event), NULL); 


labell = gtk_label_new(*Label 1*); 
label2 = gtk_label_new(*Label 2°); 


label3 = gtk_label_new(*Label 3°}; 


hbox = gtk _hbox_new { TRUE, 5 ) 
vbox = gtk vbox_new { FALSE, 10); 


gtk_box_pack_start (GTK_BOX(vbox), labell, TRUE, FALSE, 5); 
gtk_box_pack_start (GTK_BOX(vbox}), label2, TRUE, FALSE, 5); 


gtk_box_pack_start (GTK_BOX(hbox), vbox. FALSE, FALSE, 5); 
gtk_box_pack_start (GTK_BOX(hbox), label3, FALSE, FALSE, 5}; 


gtk_container_add(GTK_CONTAINER (window), hbox); 
gtk_widgec_show_all (window) ; 


gtk_main (); 


return 0; 


The Window Title 


Label 1 


16-6 


上 述 创 建 了 两 个 组 装 盒 构件 :hbox 和 vbox。 我 们 用 gtk_box_pack_start 
在 vbox 中 添加 了 labe 册 和 ]abel2, 因 为 label2 是 在 labell 之 后 添加 的 ， 所 以 
label2 出 现在 底部 。 接 下 来 ，vbox 本 身 和 ]label3 一 起 被 添加 到 hbox 中 。 

hbox 最 后 被 添加 到 窗口 中 ， 并 使 用 gtk_widget_show_all 显 示 在 屏幕 


理解 组 装 盒 布局 的 最 好 方式 是 通过 图 示 《〈 见 图 16-7) 。 
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图 16-7 


现在 你 已 经 学 过 了 构件 、 信 号 、 回 调 函 数 和 容器 构件 ， 这 些 都 是 
GTK+ 最 本 质 的 内 容 。 但 要 成 为 一 个 优秀 的 GTK+ 程 序 员 ， 你 还 需要 了 
解 如 何 充分 利用 好 它 所 提供 的 各 种 构件 。 


16.5 GTK+ 构 件 


在 本 节 中 ， 我 们 将 介绍 应 用 程序 中 最 党 用 的 一 些 GTK+ 构 件 的 
API. 


16.5.1 GtkWindow 


GtkWindow 是 所 有 GTK+ 应 用 程序 的 基本 元 素 。 我 们 用 它 来 持 有 构 
件 : 
GtkWidget 
+----GtkContainer 
+----GtkBin 
+----GtkWindow 


有 许多 的 GtkWindow API 调 用 ， 下 面 这 些 是 值得 特别 关注 的 : 


GtkWidget* gtk window new (GtkWindowType type); 

void gtk_window set title (GtkWindow *window, const gchar *title); 

void gtk window set position (GtkWindow *window, GtkWindowPosition position); 
void gtk window set default size (GtkWindow *window, gint width, gint height); 
void gtk window resize (GtkWindow *window, gint width, gint height); 

void gtk window set resizable (GtkWindow *window, gboolean resizable); 

void gtk_window_present (GtkWindow *window) ; 

void gtk_window_maximize (GtkWindow *window) ; 

void gtk _window_unmaximize (GtkWindow *window); 


正如 你 刚才 所 看 到 的 ，gtk_window_new 在 内 存 中 创建 了 一 个 新 的 空 
日 窗口 。 窗 口 的 标题 没有 设置 ， 窗 ee 你 
通常 会 将 各 种 构件 填 入 其 中 ， 并 设置 一 个 菜单 和 工具 栏 ， 然 后 才 调 用 
gtk_widget_show 在 屏 介 上 显示 它 。 

gtk_window_set_title 函 数 通 过 向 窗口 管理 器 发 出 请 求 来 改变 标题 栏 
文本 。 
注意 : 因为 是 窗口 管理 器 而 不 是 GTK+ 负 责 绘 制 窗口 周边 ， 所 以 文字 字 
体 、 颜 色 和 大 小 都 取决 于 你 所 选 的 窗口 管理 器 。 

gtk_window_set_position 控 制 窗 口 在 屏幕 上 的 初始 位 置 。 参 数 
position 有 5 个 取 值 ， 如 表 16-2 所 示 。 


表 16-2 


位 置 参数 说 il 
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gtk_window_set_default_size 按 GTK+ 绘 图 单元 设置 屏幕 pps 窗口 的 大 
小 。 明 确 设 置 屏幕 大 小 可 以 避免 窗口 内 容 不 清楚 或 被 隐藏 。 一 旦 窗口 在 
屏幕 上 显示 ， 你 可 以 通过 gtk_window_resize 来 强制 调整 窗口 大 小 。 默 认 
情况 下 ， 用 户 可 以 以 通常 的 方法 通过 拖 忠 窗口 边框 来 改变 其 大 小 。 要 阻 
正 用 户 这 么 做 ， 你 可 以 调用 gtk_window_set_resizable 函 数 ， 将 参数 
resizable 设 为 FALSE。 

为 了 确保 窗口 在 屏幕 上 并 且 对 用 尸 是 可 见 的 ， 即 它 没 有 被 最 小 化 或 
隐藏 ， 你 可 以 使 用 gtk_window_present 来 完成 这 个 任务 。 
gtk_window_present 对 于 对 话 框 来 说 很 有 用 ， 它 可 以 确保 在 你 需要 用 户 
输入 时 它们 没有 被 最 小 化 。 另 外 ， 要 强制 最 大 化 和 最 小 化 窗口 ， 你 可 以 


(H etk_window_maximizefll gtk_window_minimize rh 2. 


16.5.2 GtkEntry 


GtkEntry 是 一 个 单行 文本 输入 构件 ， 它 常用 于 输入 简单 的 文本 信 
晨 ， 例 如 电子 邮件 地 址 、 用 户 名 或 主机 名 。 你 可 以 通过 相应 的 API 调 用 
来 设置 和 读 取 输入 的 文本 ， 设 置 允 许 的 最 大 字符 数 ， 以 及 设置 其 他 一 些 
属性 来 控制 文本 的 定位 和 选择 : 
GtkWidget 
+----GtkEntry 


GtkEntry J BCE AES CB EAA SA Pe IN EPP) 来 
REWATI ROA BSI IRA, BAAN Ai EINA EFLA 
到 你 输入 的 文本 。 

下 面 我 们 将 描述 最 有 用 的 一 些 GtkEntry 函 数 : 


GtkWidget* gtk entry new (void); 

GtkWidget* gtk entry new with max length (gint max); 

void gtk entry set max length (GtkEntry *entry, gint max); 

G CONST RETURN gchar* gtk entry get text (GtkEntry *entry); 

void gtk entry set text (GtkEntry *entry, const gchar *text); 
void gtk entry append text (GtkEntry *entry, const gchar *text); 
void gtk entry prepend text (GtkEntry *entry, const gchar *text); 
void gtk entry set visibility (GtkEntry *entry, gboolean visible); 
void gtk entry set invisible char (GtkEntry *entry, gchar invch); 
void gtk entry set editable (GtkEntry *entry, gboolean editable); 


你 可 以 通过 gtk_entry_new 或 固定 最 大 文本 输入 长 度 的 


gtk_entry_new_with_max_length 来 创建 一 个 GtkEntry。 限 制 输入 不 超过 
某 一 长 度 将 省 去 你 检查 输入 长 度 ， 并 通知 用 户 文 本 输入 过 长 的 负担 。 

要 获取 GtkEntry 的 内 容 ， 你 可 以 调用 gtk_entry_get_text 疯 数 ， 它 将 
返回 GtkEntry 内 部 的 一 个 const char 指 针 (G_CONST_RETURN 是 一 个 
GLib 定 义 的 宏 )。 如 果 你 想 修改 这 个 文本 或 把 它 传 给 一 个 可 能 修改 它 的 
函数 ， 就 必须 使 用 像 strcpy 这 样 的 函数 来 复制 这 个 字符 串 。 

你 可 以 通过 _set_text、_append_text、_modift_text 函 数 来 手工 设置 或 
修改 GtkEntry 的 内 容 。 注 意 这 些 函 数 都 使 用 const 指 针 作 为 参数 。 

如 有 果 想 将 GtkEntry 作 为 一 个 密码 输入 框 使 用 ， 在 显示 字符 的 地 方 用 
星 号 来 代替 ， 你 可 以 用 gtk_entry_set_visibility 函 数 ， 并 将 它 的 参数 
Visible 设 为 FALSE。 不 可 见 字符 的 符 代 符号 可 以 根据 需要 使 用 
gtk_entry_set_invisible_char 函 数 来 改变 。 


实 验 用 户 名 和 密码 输入 框 

你 已 经 了 解 了 GtkEntry 函 数 ， 现 在 通过 一 个 小 程序 来 实际 演示 它 
们 。entry.c 将 创建 一 个 用 户 名 和 密码 输入 窗口 ， 然 后 将 输入 的 密码 与 一 
个 内 置 的 密码 相 比 较 。 

(1) 首先 定义 这 个 内 置 的 密码 ， 就 选 为 secret 吧 : 


printf 


(3) 在 main 函 数 中 ， 创 建 和 排列 界面 ， 并 且 连 接 好 回调 函数 。 我 
们 用 hbox 和 vbox 容 器 构件 来 放置 标签 和 输入 框 构件 。 


int main (int argc, char *argv{}) 

{ 
GtkWidget *window; 

tkWidget *username_label, *pasaword_label; 

GtkWidget *username_entry, *password_entry; 

GtkWidget *ok_button; 

GtkWidget *hboxl, *hbox2; 

GtkWidget *vbox; 


ao O 


gtk init(éarge, &argv); 


window = gtk_window_new(GTK_WINDOW_TOPLEVEL) ; 
gtk_window_set_title(GTK_WINDOW(window), "GtkEntryBox"); 
gtk_window_set_position (GTK_WINDOW (window) , GTK_WIN_POS_CENTER) ; 


200) 


gtk_window_set_default_size (GTX_WINDOW (window) , 200, 200); 


g_Signal_connect [| GTK_OBJECT (window), "destroy", 
GTK_SIGNAL_FUNC { closeApp), NULL); 


username_label = gtk_label_new(*Login:*); 
password_label = gtk_label_new(* Password: *); 


username_entry = gtk_entry_new(); 
password_entry = gtk_entry_new(); 
gotk_entry_set_visibility(GTK_ENTRY (password_entry), FALSE}; 


ok_button = gtk _button_new_with_label ("0k"); 


g_signal_connect (GTK_OBJECT (ok_button), "clicked", 
GTK_SIGNAL_FUNC (button clicked}, password_entry); 


hboxl = gtk _hbox_new [ TRUE, 5 ); 
hbox2 = gtk_hbox_new ( TRUE, 


w 


vbox = gtk vbox_new ( FALSE, 10) 


gtk _box_pack_start (GTK_BOX(hboxl), username_label, TRUE, FALSE, 5 
gtk_box_pack_start (GTK_BOX(hboxl), username_entry, TRUE, FALSE, 5); 


gtk_box_pack_start (GTK_BOX(hbox2), password_label, TRUE, FALSE, 5); 
gtk_box_pack_start (GTK_BOX(hbox2), password_entry, TRUE, FALSE, 5}; 


gtk_box_pack_start(GTK_BOX(vbox), hboxi, FALSE, FALSE, S): 


gtk_box_pack_start (GTK_BOX(vbox), hbox2, FALSE, FALSE, S}; 
tk_box_pack_start (GTK_BOX(vbox), ok_button, FALSE, FALSE, 5); 


gtk_container_add(GTK_CONTAINER (window), vbox) ; 


gtk_widget_show_all (window); 
gtk_main (); 


return 0; 


运行 这 序 , 你 会 看 到 如 图 16-8 所 示 的 窗口 。 

这 个 程序 创建 了 两 个 GtkEntry 构 件 (username_entry 和 
password_entry) ,并 将 password_entry 的 可 见 性 设 为 FALSE 来 隐藏 输入 的 
密码 。 然 后 它 创建 了 一 个 GtkButton, 并 将 它 的 “clicked” 信 号 连接 到 
button_clicked|=I ia] PA 2 

在 回调 函数 中 ， 程 序 将 获取 输入 的 密码 ， 并 将 它 与 内 置 的 密码 做 比 
较 ， 然 后 显示 适当 的 信息 。 


注意 ， 我 们 多 次 使 用 gtk_box_pack_start 语 名 来 癌 容 器 中 增加 构件 。 
为 了 减少 这 些 重复 的 代码 ， 你 将 在 后 面 的 例子 中 定义 一 个 辅助 函数 。 


@ erict}@kayak:/nome2/erict)pwriting/Beginning Linux Programming ath Ed/e ~ O x | 
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图 16-8 


16.5.3 GtkSpinButton 


有 了 时候 ， 你 需要 用 户 输入 一 个 数字 类 型 的 值 ， 例 如 一 个 设备 的 最 大 
速度 或 长 度 。 在 这 种 情况 下 ， 使 用 GtkSpinButton 是 最 理想 的 。 
GtkSpinButton 限 制 用 户 只 能 输入 数字 字符 ， 你 可 以 为 输入 值 设 置 上 界 和 
下 界 。 这 个 构件 还 提供 同上 和 辐 下 的 箭头 ， 用 户 仅 用 鼠标 就 可 以 很 方便 
地 选择 数值 。 

GtkWidget 
+----GtkEntry 


+----GtkSpinButton 
相应 的 API 函 数 都 很 简单 明了 ， 下 面 我 们 列 出 最 常用 的 函数 : 


GtkWidget* gtk spin button new (GtkAdjustment ‘adjustment, gdouble climb rate, 
guint digits); 

GtkWidget* gtk spin button new with range (gdouble min, gdouble max, gdouble step); 

void gtk spin button set digits (GtkSpinButton *spin_button, guint digits); 

void gtk_spin_button_set_increments (GtkSpinButton *spin_button, gdouble step, 


gdouble page); 

void gtk_spin_button_set_range (GtkSpinButton *spin_button, gdouble min, 
gdouble max); 

gdouble gtk spin button get value (GtkSpinButton *spin_button); 

gint gtk spin button get value as int (GtkSpinButton *spin_ button); 

void gtk spin button set value (GtkSpinButton *spin button, gdouble value); 


要 使 用 gtk_spin_button_new 来 创建 一 个 GtkSpinButton, 你 首先 需要 创 
建 一 个 GtkAdjust-_ ment 对 象 。GtkAdjustment 是 一 个 抽象 对 象 ， 它 包含 控 
制 有 界 数 值 的 逻辑 。GtkAdjustment 也 在 其 他 构件 中 使 用 ， 如 GtkHScale 
和 GtkVScale。 
要 创建 GtkAdjustment, 你 需要 给 它 传 递 一 个 初始 值 、 上 界 、 下 界 和 
递增 量 : 
GtkObject* gtk_adjustment_new (gdouble value, gdouble lower, gdouble upper, 


gdouble step increment, gdouble page increment, 
gdouble page size); 


step_increment 和 page_increment 的 值 分 别 设置 最 小 和 最 大 递增 量 
在 使 用 GtkSpinButton 的 情况 下 ，step_increment 设 置 点 击 箭头 时 值 变化 的 
量 。page_increment 和 page_size 对 于 GtkSpinButton 来 说 不 重要 。 
gtk_spin_button_new 的 第 二 个 参数 climb_rate 用 于 控制 当 你 持续 按 着 
箭头 按钮 时 数值 变化 的 快慢 。 最 后 ， 参 数 digits 设 置 构件 的 精度 。 
此 ， 当 digit 值 为 3 时 ，spin 按 钮 将 显示 0.00。 
gtk_spin_button_new_with_range 可 以 很 方便 地 在 创建 GtkSpinButton 
的 同时 创建 一 个 GtkAdjustment, 你 只 需 传 递 给 它 上 下 界 和 递增 量 即 可 。 
使 用 gtk_spin_button_get_value 可 以 很 容易 地 读 取 到 当前 值 。 如 果 希 
望 获得 一 个 整数 值 ， 你 可 以 使 用 gtk_spin_button_get_value_as_int。 


实 验 GtkSpinButton 
你 将 通过 一 个 小 例子 看 到 GtkSpinButton 的 实际 使 用 情况 。 这 个 程序 
名 为 spin.c。 


include <gtk/gtk.h> 
void closeApp ( GtkWidget *window, gpointer data 


gtk_main_quit(); 
} 


int main (int argc, char *argv[]) 
{ 

GtkWidget *window; 
tkWidget *spinbutton; 
GtkObject ‘adjustment; 


gtk_init (argc, Sargv); 

window = gtk_window_new(GTK_WINDOW_TOPLEVEL) ; 

gtk_window_set_default_size GTK_WINDOW (window), 300, 200); 

g_signal_connect ( GTK_OBJECT (window), "destroy", 
GTK_SIGNAL_FUNC | closeApp), NULL); 


adjustment = gtk_adjustment_new(100.0, 50.0, 150.0, 0.5, 0.05, 0.05); 
spinbutton = gtk _spin_button_new(GTK_ADJUSTMENT (adjustment), 0.0 


gtk_container_add(GTK_CONTAINER (window), spinbutton); 
gtk_widget_show_all (window) ; 


gtk_main (); 


return 0; 


运行 这 个 程序 ， 你 会 得 到 一 个 数值 在 50~~100 之 间 的 微调 (spin) 按 
钮 〈 见 图 16-9) 。 


图 16-9 


16.5.4 GtkButton 


你 已 在 程序 中 看 过 GtkButton 的 使 用 情况 ， 但 是 从 GtkButton 还 派生 
出 很 多 按钮 构件 ， 它 们 有 着 更 丰富 的 功能 ， 非 常 值得 一 提 : 


GtkButton 


+----GtkToggleButton 
+----GtkCheckButton 


+----GtkRadioButton 


从 上 面 的 构件 层次 图 中 可 以 看 到 ，GtkToggleButton 直 接 继承 自 
GtkButton, GtkCheckButton4t 7K H GtkToggleButton,GtkRadioButton4k zk 4 
GtkCheckButton。 每 个 子 构件 都 有 其 专门 用 处 。 

1. GtkToggleButton 

GtkToggleButton 和 GtkButton 几 乎 完全 一 样 ， 但 它们 之 间 有 一 个 重 
要 区 别 : Wea KA. hittin, EMIT. SHP ait 
GtkToggleButton 时 ， 它 按 通常 的 方式 发 出 “clicked” 信 号 ， 并 改变 〈 或 切 
换 ) 其 状态 。 

GtkToggleButton 的 API 函 数 非常 简单 明了 : 


GtkWidget* gtk toggle button new (void); 

GtkWidget* gtk toggle button new with label (const gchar *label); 

gboolean gtk toggle button get active (GtkToggleButton *toggle button); 

void gtk toggle button set active (GtkToggleButton *toggle button, 
gboolean is_active); 


两 个 值得 关注 的 函数 是 gtk_toggle_button_get_active 和 
gtk_toggle_button_set_active, 你 调用 它们 来 读 取 和 设置 开关 按钮 的 状态 。 
一 个 TRUE 返回 值 表明 GtkToggleButton 处 于 “ 开 ” 状 态 。 

2. GtkCheckButton 

GtkCheckButton 是 一 个 变相 的 GtkToggleButton。 它 不 像 
GtkToggleButton 那 样 显示 一 个 令 人 厌烦 的 写 形 方块 ， 而 是 显示 一 个 劳 边 
带 有 文本 的 复 选 框 ， 这 看 起 来 颇 令 人 兴奋 ， 但 两 者 之 间 并 没有 功能 上 的 
Paes 
GtkWidget* gtk check button new (void); 

GtkWidget* gtk check button new with label (const gchar *label); 

3. GtkRadioButton 

这 个 按钮 与 前 面 的 有 很 大 不 同 ， 因 为 它 可 以 与 同类 型 的 其 他 按钮 分 
为 一 组 。GtkRadioButton 是 这 样 一 种 按钮 ， 它 允许 你 一 次 只 能 从 一 组 选 
项 中 选择 一 个 。 它 的 名 字 来 源 于 老式 的 收音 机 一 一 它们 有 许多 机 械 按 
键 ， 当 你 按 下 一 个 按键 时 ， 其 他 的 按键 都 将 弹 起 来 。 


GtkWidget* gtk radio button new (GSList *group); 

GtkWidget* gtk radio button new from widget (GtkRadioButton *group); 

GtkWidget* gtk radio button new with label (GSList *group, const gchar *label); 
void gtk_radio_button_set_group (GtkRadioButton ‘*radio_button, GSList *group); 
GSList* gtk radio button get group (GtkRadioButton *radio_button); 


RadioButton 〈 单 选 按 钮 ) 组 由 一 个 Glib 的 列表 对 象 GSList 表 示 。 为 
了 将 单 选 按钮 放 在 一 个 组 里 ， 你 可 以 创 键 一 个 GSlist, 并 通过 


gtk_radio_button new 和 gtk_radio_button_get_group 来 将 它 传递 给 每 一 个 
按钮 。 不 过 ， 还 有 一 个 更 简单 的 方法 ， 通 过 
gtk_radio_button_new_from_widget 可 以 从 一 个 现 有 的 按钮 中 获取 
GSList。 你 将 在 下 一 个 例子 中 看 到 它 的 使 用 方法 。 在 下 面 的 例子 中 ， 我 
们 将 使 用 不 同 的 GtkButton。 


S 验 GtkCheckButton、GtkToggleButton 和 GtkRadioButton 
输入 下 面 这 个 程序 ， 并 把 它 命名 为 buttons.c。 (1) 首先 将 按钮 指 
针 声 明 为 全 局 变量 : 


(2) 这 里 我 们 定义 了 一 个 辅助 函数 ， 它 将 GtkWidget 和 GtkLabel 放 
入 一 个 GtkHbox 中 ， 然 后 将 这 个 GtkHbox 添 加 到 一 个 指定 的 容器 构件 
中 。 这 样 做 有 助 于 减少 重复 的 代码 。 


(3) print_active 是 另 一 个 辅助 函 数 ， 它 以 一 个 描述 字符 串 的 形式 
输出 给 定 GtkToggleButton 的 当前 状态 。 它 在 button_clicked 函 数 中 被 调 
用 ， 该 函数 是 一 个 与 OK 按钮 的 clicked 信 号 相连 接 的 回调 函数 。 每 次 这 
个 按钮 被 Kokusai ee 输出 信息 。 


(4) 在 main 函 数 中 ， 你 创建 按钮 构件 ， 将 它们 放 在 一 个 GtkVbox 
中 并 加 上 描述 标签 ， 然 后 将 回调 信号 连接 到 OK 按钮 : 


gint main (gint argc, gchar *argv[)) 
{ 

GtkWidget *window; 

GtkWidget *button; 

GtkWidget *vbox; 


gtk_init (argc, &argv); 

window = gtk _window_new(GTK_WINDOW_TOPLEVEL) ; 

gtk_window_set_default_size(GTK_WINDOW(window), 200, 200); 

g_signal_connect | GTK_OBJECT (window), "destroy", 
GTK_SIGNAL_FUNC (closeApp), NULL); 


button = gtk_button_new_with_label ("0k"); 

togglebutton = gtk_toggle_button_new with label (*Toggle"), 

checkbutton = gtk _check_button_new(); 

radiobuttonl = gtk_radio_button_new(NULL); 

radiobutton2 = gtk_radio_button_new_from_widget (GIK_RADIO_ BUTTON (radiobuttonl)); 


vbox = gtk vbox_new (TRUE, 4); 

add widget_with label (GTK_CONTAINER(vbox), *ToggleButton:*, togglebutton); 
adé_widget_with_label (GTK_CONTAINER(vbox), *CheckButton:*, checkbutton); 
adad_widget_with label (GTK_CONTAINER(vbox), “Radio 1:*, radiobuttonl); 
add_widget_with_label (GTK_CONTAINER(vbox), "Radio 2:°, radiobutton2); 
add_widget_with_label (GTK_CONTAINER(vbox), "Button:", button); 


g_signal_comnect (GTK_OBJECT(button), "clicked", 
GTK_SIGNAL_FPUNC (button_clicked), NULL); 


gtk_container_sdd (GTK_CONTAINER (window), vbox) ; 
gtk_widget_show_all (window) ; 
gtk_main (); 


return 0; 


图 16-10 显 示 了 buttons.c 程 序 的 运行 情况 ， 里 面 有 4 种 常见 类 型 的 
GtkButton. 


fie EM View Yerrminel Tabs Help 
lerict)@kayak eric src]$ ./buttons 
Checkbutton is active 
Togglebutton is active 
Radiobuttonl is not active 
Radiobutton2 is active 


Checkbutton is active 
Togglebutton is active loggle Button: 
Radicbuttonl] is active 


Radiobutton2? is not active 
| CheckBul ton: 


0 


Radio 1: 
Radio 2: 


Butron: 
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点 击 OK 可 以 看 到 各 种 按钮 的 状态 。 

这 个 程序 是 一 个 简单 的 示例 ， 它 使 用 了 4 种 类 型 的 GtkButton, 并 显示 
了 你 如 何 通 过 一 个 单独 的 函数 gtk_toggle_button_get_active 来 读 取 
GtkToggleButton、GtkCheckButton 和 GtkRadio- Button 的 状态 。 这 是 面向 
对 象 方法 最 大 的 好 处 之 一 ， 因 为 你 不 需要 为 每 个 button 类 型 准备 单独 的 
get 一 active 函 数 ， 从 而 减少 了 代码 量 。 


16.5.5 GtkTreeView 


至 此 ， 我 们 已 看 到 了 一 些 简单 的 GTK+ 构 件 ， 但 并 不 是 所 有 的 构件 
都 是 单行 输入 或 显示 的 。 GtkWidget 的 复杂 性 也 没有 受到 任何 限制 
GtkTreeView 就 是 一 个 很 好 的 例子 ， 它 封装 了 大 量 的 功能 : 


GtkWidget 
+----GtkContainer 
+----GtkTreeView 


GtkTreeView 是 GTK+2 新 增 的 构件 族 的 一 部 分 ， 它 可 以 创建 电子 表 
格 或 文件 管理 器 中 常见 的 数据 的 树 和 列表 视图 。 通 过 GtkTreeView, 你 可 
以 创建 数据 、 混 合 文本 、 位 图 、 甚 至 是 使 用 GtkEntry 构 件 输入 的 wane 
的 复杂 视图 。 

测试 GtkTreeView 最 快速 的 方法 就 是 运行 GTK+ 上 自 融 的 gtk-demo 应 用 
程序 。 这 个 演示 程序 展示 了 包括 GtkTreeView 在 内 的 各 种 GTK+ 构 件 的 能 
力 ， 如 图 16-11 所 示 。 
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GtkTreeView 构 件 族 由 下 面 4 个 组 件 构 成 。 

O GtkTreeView: 树 和 列表 视图 

口 、GtkTreeViewColumn: 代 表 一 个 列表 或 树 的 列 

O GtkCellRenderer: 控 制 绘 图 单元 

O GtkTreeModel: 代 表 树 和 列表 数据 

前 3 个 组 成 了 所 谓 的 视图 (view) ,最 后 一 个 是 模型 (model) 。 这 种 
将 视图 和 模型 分 开 的 概念 (通常 称 为 模型 /视图 /控制 器 设计 模式 ， 或 简 
称 为 MVC) 并 不 是 GTK+ 专 有 的 ， 而 是 一 个 在 整个 软件 行业 越 来 越 受 到 
青睐 的 设计 模式 。 

MVC 设 计 模 式 的 主要 优点 是 ， 数 据 可 以 同时 由 不 同 的 视图 展示 ， 
而 不 需要 进行 不 必要 的 复制 。 例 如 ， 文 本 编辑 器 可 以 分 不 同 的 窗 格 来 编 
辑 文档 的 不 同 部 分 ， 而 不 需要 在 内 存 中 保留 文档 的 两 个 副本 。 

MVC 模 式 在 Web 编 程 中 也 很 受 欢 迎 ， 这 是 因为 它 使 得 你 可 以 轻松 创 
建 一 个 满足 如 下 要 求 的 Web 站 点 : 使 用 与 蜗 面 浏览 器 不 同 的 方式 在 手机 
或 WAP 浏 览 器 上 展示 内 容 。 你 只 需 针 对 每 种 浏览 器 类 型 开发 独立 优化 
的 视图 组 件 即 可 。 你 还 可 以 将 获取 数据 的 逻辑 (如 查询 数据 库 ) 与 用 户 
界面 逻辑 相 分 离 。 

我 们 先 来 介绍 模型 组 件 ，GTK+ 有 两 个 这 样 的 组 件 : GtkTreeStore 用 
存储 如 目录 层次 结构 这 样 的 多 级 数据 ，GtkListStore 用 于 存储 平面 数 


型 


”为 了 创建 一 个 GtkTreeStore, 你 需要 传递 一 个 列 数 ， 接 着 是 每 列 的 类 


= PENA ee SP à ` 2 Cm TN O mvpP TAIT 
get store = gtx_tree_store new {3, GUitre_oli nines, Gite 


人 store 中 读 取 、 增加 、 编 辑 和 删除 数据 就 需要 使 用 GtkTreelter 结 
Ho HET Ra CBI EIT)» FRAT EJE% 
大 的 数据 结构 中 的 一 部 分 进行 定位 和 操纵 。 有 好 几 个 API 函 数 可 以 获取 
树 中 不 同位 置 的 迭代 器 对 象 ， 但 我 们 将 只 介绍 最 简单 的 
gtk_tree_store_append. 

在 癌 树 store 中 添加 任何 数据 之 前 ， 你 需要 一 个 迭代 器 对 象 来 指向 一 
个 新 行 。gtk_tree_store append 在 树 中 填 入 一 个 GtrTreelter 对 象 ， 该 对 象 
代表 一 个 新 行 ， 这 个 新 行 或 是 一 个 顶层 行 COAST “传递 的 第 三 个 参数 是 
ae ES FFT CAR OR AR TEN = PS BBE OT IE RET 

Foa 


GtkTreeIter iter; 
gtk_tree_store_append (store, &iter, NULL); 
HA NERZ, RHETT Wiel etk_tree_store_setKJA I 1% 
行 : 
gtk_tree_store_set (store, &iter, 
0, "Def Leppard", 
LE Ser 
2, TRUE, 
-1); ə 
你 成 对 地 传递 列 号 和 数据 ， 以 -1 结束 。 你 将 在 后 面 使 用 一 个 枚 举 类 
型 来 增加 列 号 的 可 读 性 。 
为 给 该 行 增加 一 个 分 支 (一 个 子 行 ) ， 你 只 需 通过 再 次 调用 
gtk_tree_store_append, 并 传递 一 个 顶层 行 来 为 子 行 创 建 一 个 迭代 器 对 
象 : 


GtkTreeIter child; 
gtk_tree_store_append (store, &child, &iter); 


你 可 以 在 API 文 档 中 找到 更 多 GtkTreeStore 和 GtkListStore 相 关 函 数 
的 资料 。 下 面 我 们 将 介绍 GtkTreeView 视 图 组 件 。 

创建 GtkTreeView 本 里 很 简单 ， 你 只 需要 同 构 造 函 数 传递 
GtkTree E a ik 


view = gtk_tree_view_new_with_m (GTK_TREE_MODE 


“现在 是 配置 构件 让 它 准确 显示 数据 的 时 ET. 针对 每 列 ， 你 都 必须 


定义 一 个 GtkCellRenderer (HRA RO) 并 设置 数据 源 。 例 如 ， 你 可 以 
选择 只 显示 某 些 列 或 交换 列 的 显示 顺序 。 

GtkCellRenderer 是 一 个 用 于 处 理 在 屏幕 上 绘制 每 个 单元 格 的 对 象 。 
它 有 3 个 子 类 ， 分 别 用 于 处 理 文本 单元 格 、 位 图 图 形 单元 格 和 开关 按钮 
单元 格 ， 如 下 所 示 : 

Ol GtkCellRendererText; 

O GtkCellRendererPixBuf; 

Ol GtkCellRendererToggle. 
你 将 在 视图 中 使 用 文本 演 染 器 GtkCellRendererText: 


stkCe R 


这 里 你 创建 了 演 染 器 对 象 并 将 它 传递 给 列 插 入 函数 。 这 个 函数 通过 
传递 给 它 的 以 NULL 结 尾 的 键 / 值 对 ， 一 次 就 设置 好 了 
GtkCellRendererText 属 性 。 传 给 函数 的 参数 分 别 是 树 视 图 、 列 号 、 列 标 
题 、 演 染 嚣 对象 和 泻 染 器 属性 。 这 里 你 设置 了 text 属 性 ， 传 递 了 数据 源 
的 列 号 。GtkCellRendererText 还 定义 了 其 他 几 个 属性 ， 包 括 下 划 线 、 了 字 
TK. Kp. 

你 将 在 下 面 的 例子 中 看 到 GtkTreeView 的 实际 使 用 情况 。 


实 验 GtkTreeView 

输入 这 个 程序 ， 将 它 命名 为 tree.c. 

(1) 程序 使 用 一 个 枚 举 类 型 来 标记 列 ， 这 样 你 就 可 以 用 名 字 来 引 
用 它们 。N_COLUMNS 是 总 列 数 。 


#include <gtk/gtk.h> 


enum { 
COLUMN_TITLE, 
COLUMN_ARTIST, 
COLUMN_CATALOGUE, 
N_COLUMNS 

}; 


void closeApp ( GtkWidget ‘window, gpointer data) 
{ 

gtk_main_quit(); 
} 


int main (int argc, char *argv{[]) 
{ 
GtkWidget *window; 
GtkTreeStore *store; 
GtkWidget “view; 
GtkTreeIter parent_iter, child_iter; 
GtkCellRenderer *renderer; 


gtk_init(&arge, argv); 

window = gtk_window_new(GTK_WINDOW_TOPLEVEL) ; 

gtk_window_set_default_size ( GTK_WINDOW(window), 300, 200); 

g_signal_connect ( GTK_OBJECT (window), "destroy", 
GTK_SIGNAL_FUNC { closeApp), NULL}; 


(2) 下 面 创建 了 树 store, 并 癌 其 传递 列 的 总 数 和 每 列 的 类 型 : 
store = gtk_tree_store_new (N_COLUMNS, G_TYPE_STRING, G_TYPE_STRING, 
G_TYPE_STRING) ; 
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(3) 接 下 来 向 树 中 增加 一 个 父 行 和 一 个 子 行 : 

gtk_tree_store_append (store, &parent_iter, NULL); 

gtk_tree_store_set (store, &parent_iter, COLU TITLE, “Dark Side of the Moon", 
COLUMN_ARTIST, "Pink Floyd’, 
COLUMN_CATALOGUE, “BOQ0024D4P", 
al); 

gtk_tree_store_append (store, &child_iter, &parent_iter) ; 

gtk_tree_store_set (store, &child_iter, COLUMN_TITLE, “Speak to Me", 


~1); 


view = gtk_tree_view_new_with_model (GTK_TREE_MODEL (store}); 


(4) 最 后 ， 把 列 加 到 视图 中 ， 并 设置 它们 的 数据 源 和 标题 : 


text_new (); 


renderer = gtk_cell_renderer_ 
gtk_tree_view_insert_column_with_attribut _TREE_ 
OLUMN_ $ 
text" J] T E 
ULL 
gtk_tr | insert_colum_ hat u Ti REE_ ev 
"Art e e 
te) MI 
NULL) ; 
gtk_tree w_ ert_column_with_ bute TK_TREE 
TIMA 
Aw 
rer 
ew) 


CONTAINER (window) , 


mw 


gtk_container_add (GT! 


gtk_widget_show_all (window) 


gtk_main (); 


return 0; 


后 面 会 把 GtkTreeView 作 为 CD 应 用 程序 的 核心 ， 在 该 程序 中 查询 


CD 数据 库 时 ， 我 们 将 修改 GtkTreeView 的 代码 。 
我 们 已 经 了 解 了 GTK+ 构 件 ， 现 在 我 们 将 把 注意 力 转 向 GNOME。 


后 面 我 们 将 学 习 如 何 使 用 GNOME 库 向 应 用 程序 中 添加 菜单 ， 以 及 
GNOME 构 件 是 如 何 使 得 为 GNOME 桌 面 编程 变 得 更 容易 。 


16.6 GNOME 构件 


GTK+ 被 设计 成 独立 于 桌面 的 。 也 就 是 说 ，GTK+ 并 不 假定 它 运 行 
在 GNOME 中 ， 甚 至 不 假定 它 运 行 在 Linux 上 。 这 样 ，GTK+ 就 可 以 被 相 
对 容易 地 移植 到 Windows 或 者 任何 其 他 视窗 系统 中 。 可 这 样 导 致 的 结 
是 ，GTK+ 缺 乏 将 程序 与 桌面 紧密 结合 的 方法 ,例如 保存 程序 配置 、 显 示 
帮助 文件 或 编写 applet 〈applet 是 在 边缘 面板 上 运行 的 小 程序 ) 的 方法 。 

GNOME 库 包含 GNOME 构 件 ， 它 们 扩展 了 GTK+, 并 用 一 些 更 容易 使 
用 的 构件 蔡 换 了 GTK+ 中 的 部 分 构件 。 在 本 节 中 ， 我 们 将 看 到 如 何 用 
GNOME 构 件 来 编程 。 

在 使 用 GNOME 库 之 前 ， 你 必须 在 程序 的 一 开始 对 它们 进行 初始 
化 ， 就 像 你 在 使 用 GTK+ 时 所 做 的 那样 。 你 在 纯 GTK+ 程 序 中 调用 的 是 
gtk_init, 在 这 里 调用 的 是 gnome_program_init。 

这 个 函数 的 参数 有 : app_id 和 app_version (用 于 向 GNOME 描 述 你 
的 程序 ) 、module_ info 〈 告 诉 GNOME 初 始 化 哪个 库 模 块 ) 、 命 令 行 参 
数 和 应 用 程序 属性 〈 设 置 为 以 NULL 结 尾 的 “名 / 值 ? 对 列表 ) 。 


int argc, char **argv, 
const char *first_property_name, 


可 选 的 属性 列表 用 来 设置 一 些 属性 ， 如 位 图 查找 目录 。 


sx Ky 一 个 GNOME 窗 口 
现在 让 我 们 来 看 一 个 GNOME 程 序 ， 注 意 GtkWindow 在 GNOME 中 
被 蔡 代 为 GnomeApp 构 件 。 


输入 这 个 程序 ， 将 它 命名 为 gnomel.c: 


a *argv | 


为 编译 这 个 程序 ， 你 需要 包含 GNOME 头 文件 ， 因 此 传递 
libgnomeui 和 1libgome 给 pkg-config: 


gcc gnomel.c -o gnomel pkg-config --cflags --libs libgnome-2.0 libgnomeui-2.0° 


GnomeA ppt {FX} Gtk Window ír SHE, EMR TE 
以 及 底部 的 状态 栏 变 得 很 容易 。 因 为 GnomeApp 继 承 目 GtkWindow, 所 以 
你 可 以 将 GnomeApp 构 件 用 于 任何 GtkWindow 函 数 。 接 下 来 ， 你 将 学 习 
创建 染 单 。 在 本 章 最 后 一 个 例子 中 ， 你 将 添加 一 个 状态 栏 。 
你 可 以 使 用 GTK+ 来 创建 菜 蛙 ， 但 GNOME 所 提供 的 结构 和 宏 
使 得 这 个 工作 变 得 更 容易 了 。 在 线 的 GTK+ 文 档 描述 了 如 何 使 用 
GTK+ 来 创建 菜单 。 


16.7 GNOME 


在 GNOME 中 创建 一 个 下 拉 式 的 菜单 栏 非常 简单 。 菜 单 栏 中 的 每 个 
菜单 都 由 一 个 GNOMEUIInfo 结 构 的 数组 来 表示 ， 数 组 中 的 每 个 元 素 对 
应 于 一 个 菜单 项 。 例 如 ， 如 果 你 有 File、Edit、View3 个 菜单 ， 就 用 3 个 
数组 来 分 别 描述 每 个 菜单 的 内 容 。 

一 旦 定义 好 每 个 菜单 ， 你 就 可 以 通过 在 另 一 个 GNOMEUIInfo 结 构 
的 数组 中 引用 这 些 数 组 来 创建 菜单 栏 本 身 。 

GNOMEUIInfo 结 构 有 点 复杂 ， 需 要 解释 一 下 : 


typedef struct { 
GnomeUIInfoType type; 
gchar const *label; 
gchar const *hint; 
gpointer moreinfo; 
gpointer user_data; 
gpointer unused _ data; 
GnomeUIPixmapType pixmap_ type; 
gconstpointer pixmap_info; 
guint accelerator _key; 
GdkModifierType ac_mods; 
GtkWidget *widget; 
} GnomeUlIinfo; 
该 结构 中 的 第 一 项 type 定 义 了 菜单 元 素 的 类 型 。 它 可 以 是 GNOME 
定义 的 10 个 GnomeUIInfoType 类 型 中 的 一 个 ， 如 表 16-3 所 示 。 


表 16-3 


25 RAP 8 — SAS = PS EXN 的 文本 和 弹 出 提示 
(提示 显示 在 窗口 底部 的 状态 栏 中 ) 。 

moreinfo 的 目的 取决 于 type。 对 ITEM 和 TOGGLEITEM 它 指 PES 
项 被 激活 时 调用 的 回调 函数 。 对 RADIOITEMS , 它 指向 一 个 定义 单 选 按 
钮 组 的 GnomeUIInfo 结 构 数 组 。 

user_data 是 一 个 传递 给 回调 函数 的 任意 指针 。Ppixmap_type 和 
pixzmap_info 用 于 为 染 单 项 增加 一 个 位 图 网 标 ，accelerator_ key 和 
ac_modes 用 于 定义 一 个 快捷 键 。 

最 后 ，widget 用 于 在 内 部 保存 由 沫 单 创 建 函 数 指 加 的 沫 单项 构件 。 


Sk 验 GNOME 菜 单 
你 可 以 通 过 这 个 小 程序 来 试 一 试 菜单 ， 这 个 程序 名 为 menul.c。 


(1) Bi 数 item_clicked: 


‘widget, gpointer user_data 


”2) BEB RERHEX. MATER, -AMERRE 
菜单 栏 数 组 : 


static GnomeUliInfo submenu[) = { 

(GNOME_APP_UI_ITEM, "SubMenu’, “SubMenu Hint’, 

GTK_SIGNAL_FUNC (item_clicked), NULL, NULL, 0, NULL, 0, 0, NULL}, 

(GNOME_APP_UI_ENDOFINFO, NULL, NULL, NULL, NULL, NULL, 0, NULL, 0, 0, NULL) 
static GnomeUlInfo menu(} = ( 

{GNOME_APP_UI_ITEM, "Menu Item 1*, "Menu Hint", 

NULL, NULL, NULL, 0, NULL, 0, 0, NULL), 

{GNOME_APP_UI_SUBTREE, “Menu Item 2", "Menu Hint*, submenu, 

NULL, NULL, 0, NULL, 0, 0, NULL), 


{GNOME_APP_UI_ENDOFINFO, NULL, NULL, NULL, NULL, NULL, 9, NULL, 0, 0, NULL} 
}; 


static GnomeUIInfc menubar[] = { 
(GNOME_APP_UI_SUBTREE, "Toplevel Item", NULL, menu, NULL, 
NULL, 0, NULL, 0, 0, NULL), 
({GNOME_APP_UI_LENDOFINFO, NULL, NULL, NULL, NULL, NULL, 0, NULL, 0, 0, NULL} 


(3) 在 main 函 数 中 ， 进 行 一 些 初 始 化 ， 然 后 创建 GnomeApp 构 件 并 
WES: 
int main (int argc, char *argvi]) 
tkWidget ‘app; 
gnome _program_init (*gnomel", "0.1", LIBGNOMEUI_MODULE, 
argc, argv, 
GNOME_PARAM_NONE)} ; 


app = gnome_app_new(*gnomel*, "Menus, menus, menus"); 


gtk_window_set_default_size ( GTK_WINDOW(app), 300, 200); 
g_signal_connect { GTK_OBJECT (app), "destroy", 

GTK_SIGNAL_FUNC ( closeApp), NULL); 
gnome_app_create_menus ( GNOME_APP(app), menubar); 
gtk_widget_show(app) ; 


gtk_main{); 
return 0; 


试 着 运行 menul 程 序 ， 你 可 以 看 到 菜单 栏 、 子 染 单 及 回调 函数 的 实 
际 运行 情况 ,如 图 16-12 所 示 。 


a Menus, menus, menus 


Toplevel item 


Menu item 1 
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GnomeUIlInfo 结 构 对 程序 员 不 是 太 友 好 ， 因 为 它 包 含 11 个 成 员 ， 大 
多 数 成 员 的 值 在 通常 情况 下 都 是 NULL 或 零 。 你 在 输入 它们 的 时 候 很 容 
易 出 错 ， 而 且 在 一 个 很 长 的 荣 单 项 数组 中 ， 你 很 难 将 它们 一 一 区 分 。 为 
了 改善 这 种 情况 ，GNOME 定 义 了 宏 来 减少 手工 输入 的 腑 烦 。 这 些 宏 还 
可 以 增加 图 标 和 键盘 快捷 键 ， 而 不 需要 任何 开销 。 事 实 上 ， 我 们 没有 任 


何 理由 不 使 用 这 些 宏 。 
有 两 组 宏 ， 第 一 组 定义 单独 的 菜单 项 。 它 们 需要 两 个 参数 : 回调 函 
数 指 针 和 用 户 数 据 。 
#include <libgnomeui/libgnomeui .h> 
#define GNOMEUIINFO MENU OPEN ITEM (cb, data) 
#define GNOMEULINFO MENU SAVE_ITEM (cb, data) 
#define GNOMEUIINFO MENU SAVE AS ITEM (cb, data) 
#define GNOMEUIINFO MENU PRINT ITEM (cb, data) 
#define GNOMEULINFO_MENU_PRINT_SETUP_ITEM(cb, data) 
#define GNOMEUIINFO MENU CLOSE ITEM (cb, data) 
#define GNOMEUIINFO MENU EXIT ITEM (cb, data) 
#define GNOMEUIINFO MENU QUIT ITEM (cb, data) 
#define GNOMEUIINFO MENU CUT_ITEM (cb, data) 
#define GNOMEUIINFO MENU COPY ITEM (cb, data) 
#define GNOMEUIINFO MENU PASTE ITEM (cb, data) 
#define GNOMEULINFO_ MENU SELECT ALL ITEM(cb, data) 


。 etc 


第 二 组 用 于 顶层 沫 单 定义 ， 你 只 需 传 递 数 组 即 可 : 


#define GNOMEULINFO MENU FILE TREE (tree) 
#define GNOMEUIINFO MENU EDIT TREE (tree) 
#define GNOMEUIINFO MENU VIEW TREE (tree) 
#define GNOMEUIINFO MENU SETTINGS TREE (tree) 
#define GNOMEUIINFO MENU FILES TREE (tree) 
#define GNOMEULINFO_MENU_WINDOWS_ TREE (tree) 
#define GNOMEULINFO_MENU_HELP TREE (tree) 
#define GNOMEULINFO MENU GAME TREE (tree) 


实 验 使 用 GNOME 宏 来 定义 菜单 

在 本 例 中 ， 我 们 通过 这 些 荣 单 来 看 看 宏 是 怎样 工作 的 。 对 menul.c 
做 如 下 改动 ， 并 将 它 保 存 为 nenu2.c (为 简单 起 见 ， 本 例 中 的 菜单 选择 
没有 定义 回调 函数 。 本 例 只 是 为 了 说 明 GNOME 沫 单 宏 的 便利 ) 。 


u Hint*, NULL, NULL ) 


ANUL, Ment, MEMI 


通过 在 menu2.c 中 使 用 libgnomeui 宏 ， 极 大 地 减少 了 需要 输入 的 代码 
并 使 菜单 代码 更 容易 理解 了 。 这 些 宏 不 仅 节省 了 开发 者 时 间 和 粮 
还 有 助 于 创建 菜单 首 使 菜单 的 字体 、 键 盘 快捷 方式 和 图 标 与 其 他 


-> 


+ 


GNOME 程 序 保 持 一 致 。 在 程序 开发 中 ， 我 们 应 该 尽 可 能 多 地 使 用 这 些 
Fe 

图 16-13 显 示 了 menu3.c 的 运行 情况 ， 它 拥有 一 个 标准 化 的 GNOME 
荣 单项 。 


m Menus, menus, menus 


A Edit 


Save As... Shift+Ctr+5 — 


$] Quit CtH+Q 
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16.8 “对话 框 


GUI 应 用 程序 的 一 个 重要 组 成 部 分 就 是 与 用 户 交 互 并 通知 用 户 重要 
的 事件 。 通 常 ， 你 会 为 此 创建 一 个 临时 的 带 有 OK 和 Cancel 控 钮 的 窗 
口 。 如 果 信 息 非 常 重要 , 它 需 要 一 个 立即 啊 应 《如 删除 一 个 文件 ) ， 你 
就 希望 能 够 阻止 用 户 访问 任何 其 他 窗口 ， 直 到 他 做 出 了 一 个 选择 《〈 这 类 
窗口 被 称 为 模式 对 话 框 ) 。 

我 们 在 这 里 讲述 的 就 是 对 话 框 。GTK+ 提 供 了 一 个 从 GtkWindow 派 
生 的 特殊 对 话 框 构件 ， 可 以 让 编程 变 得 更 加 容易 。 


16.8.1 GtkDialog 


正如 你 所 看 到 的 ，GtkDialog 是 GtkWindow 的 一 个 子 类 ， 因 此 它 继承 
了 GtkWindow 的 所 有 函数 和 属性 : 


GtkWindow 
+----GtkDialog 


_GtkDialog 将 窗口 分 为 两 个 区 域 ， 一 个 放 构 件 的 内 容 ， 一 个 放 压 部 
的 按钮 。 你 可 以 在 创建 对 话 框 时 指定 你 想 要 的 按钮 和 其 他 对 话 框 设置 。 
GtkWidget* gtk dialog new with buttons (const gchar *title, 
GtkWindow *parent, 
GtkDialogFlags flags, 
const gchar *first_button text, 


...)} 

这 个 函数 创建 了 一 个 完整 的 带 有 标题 和 按钮 的 对 话 框 窗口 。 第 二 个 
参数 parent 应 指向 应 用 程序 的 主 窗口 ， 这 样 GTK+ 才 可 以 确保 对 话 框 是 一 
直 连 接 到 主 窗 口 的 。 当 主 窗 口 被 最 小 化 时 ， 它 也 会 跟 看 最 小 化 。 

flags 参 数 决定 了 对 话 框 可 以 拥有 的 属性 组 合 : 

O GTK_DIALOG_MODAL: 

口 GTK_DIALOG_DESTROY_WITH_PARENT: 

O GTK_DIALOG_NO_SEPARATOR. 

你 可 以 将 这 些 标 记 用 按 位 或 操作 符 组 合 起 来 ， 例 如 ， 

(GTK_DIALOG_MODAL|GTK_DIALOG_ NO_SEPARATOR) 既是 一 
个 模式 对 话 框 ， 又 是 一 个 在 主 窗口 区 域 和 按钮 区 域 之 间 没 有 分 割 线 的 对 


话 框 。 

其 余 的 参数 是 一 个 以 NULL 结 尾 的 按钮 和 相应 的 啊 应 代码 列表 。 你 
将 在 后 面 看 到 gtk_dialog_run 函 数 时 明白 响应 代码 的 含义 。 通 第， 你 会 从 
A 这 些 按钮 中 也 有 定义 好 的 图 
小 o 

下 面 显 示 了 创建 一 个 带 有 OK 和 Cancel 按 钮 的 对 话 框 的 代码 ， 它 会 
根据 按 下 的 按钮 分 别 返 回 GTK_RESPONSE_ACCEPT 和 
GTK_RESPONSE_REJECT: 


3 "Important quest Į 
10w 


我 们 在 这 里 选择 创建 两 个 按钮 ， 但 是 对 话 框 并 没有 限制 可 以 放置 的 
按钮 数目 。 此 外 ， 你 可 以 从 一 组 啊 应 类 型 标记 中 进行 选择 。accept 和 
reject 标 记 没 有 被 标准 GNOME 使 用 ， 因 此 你 可 以 随意 在 应 用 程序 中 使 用 
它们 ( 记 住 ， 在 你 的 应 用 程序 中 ，accept 应 意味 着 接受 ) 。 其 他 在 这 里 
可 以 使 用 的 标记 包括 OK 和 CANCEL, 共 体 请 见 下 一 节 中 的 
GtkResponseType 枚 举 类 型 。 

当然 ， 你 需要 同 对 话 框 中 添加 内 容 ， 这 个 GtkDialog 包 含 一 个 现成 
的 GtkVBox 来 容纳 构件 。 你 直接 从 这 个 对 象 获 得 一 个 指针 4 


GtkWidget *vbox = GTK_DIALOG(dialog) ->vbox; 


你 以 通常 的 方式 使 用 这 个 GtkVBox, 比 如 通过 gtk_box_pack_start 或 者 
其 他 类 似 的 函数 。 

一 旦 创建 好 一 个 对 话 框 ， 下 一 步 就 是 将 它 展 现 给 用 户 ， 并 等 待 啊 
应 。 这 可 以 使 用 下 面 两 种 方法 来 完成 : 一 种 是 模式 的 方法 ， 它 阻止 除 对 
话 框 以 外 的 一 切 输入 ; 一 种 是 非 模 式 的 方法 ， 它 像 对 待 其 他 窗口 一 样 对 
待 对话 框 。 让 我 们 先 看 看 运行 一 个 模式 对 话 框 。 


16.8.2 模式 对 话 框 


模式 对 话 框 强制 用 户 首先 响应 ， 然 后 才能 进行 任何 其 他 动作 。 它 对 
用 户 将 要 做 一 件 有 严重 后 果 的 事情 ， 或 报告 错误 
N= 言 息 。 

你 可 以 通过 设置 GTK_DIALOG_ MODAL 标记 和 调用 
gtk_widget_show 了 兄 数 ， 使 一 个 对 话 框 变 为 模式 对 话 框 。 但 还 有 一 个 更 好 
的 方法 。gtk_dialog 一 run 通 过 阻止 程序 的 进一步 执行 ， 直 到 一 个 按钮 被 
按 下 ， 来 帮 你 解决 这 个 难题 。 


当 用 户 按 下 一 个 按钮 (或 者 对 话 框 被 关闭 ) 时 ，gtk_dialog_run 返 回 
一 个 int 类 型 的 结果 来 表明 用 户 按 下 了 哪个 按钮 。GTK+ 通 常 定义 一 个 榴 
举 类 型 来 摘 述 可 能 的 值 : 

typedet enum 

{ 
GTK_RESPONSE_NONE = -1, 
GTK_RESPONSE_REJECT = -2, 
GTK_RESPONSE_ACCEPT = -3, 
GTK_RESPONSE_DELETE EVENT = -4 


GTK_RESPONSE_OK = -5, 
GTK_RESPONSE_CANCEL = -6, 
GTK_RESPONSE_CLOSE = -7, 
GTK_RESPONSE_YES = -8, 
GTK_RESPONSE_NO = -9, 
GTK_RESPONSE_APPLY = -10, 
GTK_RESPONSE_HELP = -11 


} GtkResponseType; 


现在 我 们 可 以 解释 传递 给 gtk 一 dialog_new_with_buttons 的 结果 代码 
了 。 结 果 代 码 是 在 按钮 被 按 下 时 ，gtk_dialog_run 返 回 的 一 个 
GtkResponseType 值 。 如 果 对 话 框 被 关闭 (例如 用 户 点 击 了 关闭 图 
标 ) ， 你 将 得 到 一 个 GTK_RESPONSE_NONE 的 结果 。 
switch 结 构 非 常 适 合 于 执行 这 个 逻辑 流程 : 
GtkWidget *dialog = create_dialog(); 
int result = gtk_dialog_run(GTK_DIALOG(dialog) ) ; 


switch (result) 


case GTK_RESPONSE_ACCEPT: 
delete _file(); 
break; 

case GTK_RESPONSE_REJECT: 
do_nothing() ; 
break; 

default: 


dialog_was_cancelled (); 
break; 
} 
gtk_widget_destroy (dialog) ; 
这 了 就 是 GTK+ 中 简单 的 模式 对 话 框 的 所 有 内 容 了 。 正 如 你 所 看 到 
的 ， 这 不 需要 你 花费 多 少 精力 或 编写 多 少 代 人 码 。 最 后 你 只 需 用 
gtk_widget_destroy 进 行 清理 。 
但 当 你 需要 一 个 非 模式 对 话 框 时 ， 事 情 就 不 是 那么 简单 了 。 你 不 能 
使 用 gtk_dialog_run, 而 是 必须 将 对 话 框 的 按钮 与 回调 函数 连接 。 


16.8.3 中式 对 话 框 


你 已 看 到 如 何 用 gtk_dialog_run 来 创建 一 个 模式 《阻塞 ) 对 话 框 了 。 
非 模式 对 话 框 的 工作 方式 稍 有 不 同 ， 尽 管 它们 是 用 同一 种 方法 创建 的 。 
你 不 是 调用 gtk_dialog_run, 而 是 将 一 个 回调 函数 连接 到 GtkDialog 
的 “response” 信 号 〈 这 个 信号 在 按钮 被 按 下 或 窗口 被 关闭 时 发 出 ) o 

将 回调 函数 连接 到 信和 号 是 按 通 名 的 方式 来 完成 的 ， 但 有 一 点 不 同 : 
回调 函数 有 一 个 额外 的 “response 参数 ， 它 起 着 和 gtk 一 dialog_run 返 回 值 
相同 的 作用 。 下 面 的 代码 片断 显示 了 一 个 非 模式 对 话 框 的 基本 用 法 : 


spons gpointer 


JERAN ES BER REIRI KAHA A El] 9 BY Hg Dv Xp 


Tate, fA De MO EIA Ctl. UR Ee, WOR ERA 
第 一 个 对 话 框 之 前 又 试图 第 二 次 打开 这 个 对 话 框 时 ， 你 该 如 何 做 。 你 要 
做 的 就 是 检查 对 话 框 指针 是 否 为 NULL, 如 宁 不 是 就 调用 
gtk_window_present 来 重新 显示 已 存在 的 对 话 框 。 你 可 以 在 本 章 最 后 一 
市 中 看 到 它 的 实际 使 用 情况 。 


16.8.4 GtkMessageDialog 
对 于 非常 简单 的 对 话 框 来 说 ， 即 使 GtkDialog 也 显得 过 于 复杂 了 : 
GtkDialog 
+----GtkMessageDialog 


通过 使 用 GtkMessageDialog, 你 仅 用 一 行 代码 就 可 以 创建 一 个 消息 对 
TATE -o 
GtkWidget* gtk message dialog new (GtkWindow *parent, GtkDialogFlags flags, 
GtkMessageType type, 
GtkButtonsType buttons, 
const gchar *message_ format, 
a ej 


这 个 函数 创建 了 一 个 带 有 图 标 、 标 题 和 可 配置 按钮 的 完整 对 话 框 。 
参数 type 根 据 对 话 框 的 目的 设置 它 的 图 标 和 标题 ， 例 如 ， 和 警告 类 型 有 一 
个 三 角 警 示 图 标 。 你 最 常 辜 到 的 简单 对 话 框 有 下 面 4 种 可 能 的 类 型 值 : 

CO GTK MESSAGE_INFO; 

O GTK MESSAGE WARNING; 

o GTK_ MESSAGE_ QUESTION: 

O GTK _ MESSAGE ERROR. 

你 还 可 以 选择 一 个 GTK_MESSAGE_OTHER 值 ， 它 用 于 前 述 对 话 框 


类 型 都 不 适用 的 情况 。 对 于 GtkMessageDialog, 你 可 以 传递 一 个 
GtkButtonsType 而 不 是 分 别 列 出 每 个 按钮 ， 如 表 16-4 所 示 。 
表 16-4 


RP ABET THEM CAS, PRAT DEAD REF BOR IEE, W 
ee ae 在 本 例 中 ， 我 们 询问 用 户 是 否 确实 要 删除 一 个 文 


GtkWidget *dialog = gtk_message_dialog_new (main_window, 
GTK_DIALOG_DESTROY_WITH_PARENT, 
GTK_MESSAGE_QUESTION, 
GTK_BUTTONS_YES_NO, 
“Are you sure you wish to delete ts?°, 
filename); 

result = gtk_dialog_run (GTK_DIALOG (dialog)); 

gtk_widget_destroy (dialog); 


这 个 对 话 框 如 图 16-14 所 示 。 


图 16-14 


” ”GtkMessageDialog 是 传递 信息 或 询问 yes/no 类 型 问题 的 最 简单 方 
法 。 你 将 在 下 一 节 为 CD 应 用 程序 创建 GUI 时 用 到 它 。 


16.9 CD MHRA 


在 前 面 的 章节 中 ， 你 用 MySQL 和 C 语 言 接口 开发 了 一 个 CD 数据 库 
应 用 程序 。 现 在 你 将 看 到 ， 用 GNOME/GTK+ 给 该 程序 创建 一 个 GUI 前 
端 是 多 么 容易 ， 开 发 一 个 丰富 的 用 户 界 面 是 多 么 快捷 。 


就 像 第 8 章 中 的 CD 数据 库 应 用 程序 的 需求 一 样 ， 为 运行 本 章 中 


为 了 简明 起 见 ， 你 将 开发 一 个 基础 的 、 骨 架 式 的 用 户 界 面 ， 它 仅 实 
现 应 用 程序 的 部 分 功能 。 例 如 ， 你 不 允许 往 CD 里 增加 曲目 信息 或 从 CD 
里 删除 曲目 信息 。 你 将 在 这 个 应 用 程序 里 看 到 本 章 所 介绍 的 构件 的 实际 
使 用 情况 ， 这 样 你 就 可 以 了 解 它 们 在 现实 情况 中 是 如 何 使 用 的 了 。 

你 将 实现 的 主要 功能 
通过 GUI 登录 数据 库 ; 
查找 CD; 
显示 CD 和 曲目 信息 ; 
问 数 据 库 中 增加 一 张 CD; 
创建 一 个 “关于 ”(About) 窗口 ; 
在 用 户 退 出 时 进行 确认 。 

你 把 代码 分 为 3 个 源 文件 ， 它 们 共享 同一 个 头 文件 cdapp_gnome.h。 
aa 界面 生成 函数 与 回调 函数 分 


品 口 口 口 口 口 


实 验 cdapp_gnome. h 
先 来 看 看 cdapp_gnome.h， 它 声明 了 那些 你 需要 实现 的 函数 。 
(1) 包含 GNOME 头 文件 和 你 在 第 8 章 中 开发 的 接口 函数 所 对 应 的 
头 文件 。 这 个 示例 程序 使 用 了 第 8 章 中 的 app_mysql.h 文 件 和 app_mysq1l.c 
文件 ， 以 及 该 章 中 创建 的 数据 库 。 


#include <gnome.h> 
#include “app_mysql.h" 


(2) 枚 举 类 型 标记 了 GtkTreeView 构 件 的 列 ， 你 将 用 GtkTreeView 


enum { s 
COLUMN_TITLE, 
COLUMN_ARTIST, 
COLUMN_CATALOGUE, 
N_COLUMNS 
Fi 


(3) 在 interface.c 文 件 中 有 3 个 窗口 创建 函数 : 


GtkWidget *create_main_window(); 
GtkWidget *create_login_dialog(); 
GtkWidget *create_addcd dialog(); 
(4) 针对 荣 单 项 、 工 具 栏 、 对 话 框 按钮 和 搜索 按钮 的 回调 函数 在 
callbacks.c 文 件 中 : 


/* Callback to quit application */ 
void quit_app( GtkWidget * window, gpointer data); 


/* Callback useful for confirming exit before quitting */ 
gboolean delete_event_handler ( GtkWidget *window, GdkEvent ‘event, gpointer data); 


/* Callback connected to ‘response’ signal of addcd dialog */ 

void added dialeg_button_clicked (GtkDialog * dialog, gint response, 
gpointer userdata); 

/* Callback for menu and toolbar ‘Add CD’ button */ 


void on_addcd_activate (GtkWidget *widget, gpointer user_data); 


/* Callback for menu ‘About’ button */ 
void on_about_activate (GrkWidger ‘widget, gpointer user_data); 


/* Callback for search button */ 
void on_search_button_clicked (GtkWidget ‘widget, gpointer userdata);: 


S 验 interface.c 
接着 ， 首 先 来 看 一 下 interface.c， 该 文件 定义 了 你 在 应 用 程序 中 使 用 
的 窗口 和 对 话 框 。 
(1) 首先 是 在 callbacks.c 和 main.c 中 引用 的 一 些 构件 指针 ; 


include “app_gnome.h* 


GtkWidget *treeview; 
GtkWidget *appbar; 
GtkWidget *artist_entry; 
GtkWidget *title_entry; 
GtkWidget *catalogue_entry; 
GtkWidget *username_entry; 
GtkWidget *password_entry; 


(2) app 是 一 个 具备 文件 作用 域 的 主 窗口 指针 : 
static GtkWidget ra 
(3) 定义 一 个 辅助 函数 ， 它 把 一 个 带 有 指定 文本 标签 的 构件 添加 


BA as 


void add_widget_with_label { GtkContainer *box, gchar ‘caption, GtkWidget ‘*widget) 
{ 

GtkWidget *label = gtk_label_new (caption); 

GtkWidget *hbox = gtk.hbox_new (TRUE, 4); 


gtk_container_add(GTK_CONTAINER (hbox), label); 
gtk_container_add(GTK_CONTAINER (hbox), widget); 


gtk_container_add(box, hbox}; 


(4) 为 方便 起 见 ， 荣 单 栏 的 定义 使 用 了 GNOMEUIINFO 安 : 


static GnomeUlIInfo filemenu[] = 

{ 

GNOMEUIINFO_MENU_NEW ITEM {*_New.CD*, NULL, on_addcd_activate, NULL), 
GNOMEUTINFO_SEPARATOR, 

GNOMEUIINFO_MENU_EXIT_ITEM (close_app, NULL), 

GNOMEUIINFO_END 

); 


static GnomeUIInfo helpmenu[) = 

{ 
GNOMEUTINFO_MENU_ABOUT_ITEM (con about activate, NULL), 
GNOMEUIINFO_END 

); 


static Gnomel/IInfo menubar Í ] 
{ 
GNOMEUIINFO_MENU_FILE_TREE (filemenu), 


GNOMEULINFO_MENU_HELP_TREE (helpmenu), 
GNOMEULINFO_END 


(5) 创建 主 窗口 ， 向 其 中 添加 菜单 和 工具 栏 ， 设 置 其 大 小 ， 将 它 
放置 在 屏幕 中 央 ， 组 装 构成 用 户 界面 的 构件 。 注 意 ， 这 个 函数 并 未 在 屏 
幕 上 显示 窗口 ， 而 是 返回 一 个 指向 窗口 的 指针 。 


GtkWidget * create_main_ window() 
r 
( 


GtkWidget *toolbar; 
GtkWidget *vbox; 
GtkWidget *hhox; 
GtkWidget * label; 
GtkWidget ‘entry: 
GtkWidget *search_ button; 
GtkWidget *scrolledwindow; 
GtkCellRenderer *renderer; 


app = gnome_app_new {"GnomeCD", "CD Database") ; 


gtk_window_set_position | GTK_WINDOW! app), GTK WIN_POS_CENTER) ; 
gtk_window_set_default_size ( GTK_WINDOW( app }, 540, 480); 


gnome app create menus [GNOME APP (app), menubar); 


(6) 使 用 GTK+ 目 市 的 图 标 来 创建 工具 栏 ， 并 连接 回调 函数 : 


toolbar = gtk_toolbar_new (); 


gnome_app_add_toolbar (GNOME_APP (app), GTK_TOOLBAR (toolbar), ‘toolbar", 
BONOBO_DOCK_ITEM_BEH_EXCLUSIVE 


BONOBO_DOCK_TOP, 1, 0, 0); 
gtk_container_set_border_width (GTK_CONTAINER (toolbar), 1); 
gtk_toolbar_insert_stock (GTK_TOOLBAR (toolbar), 
*gtk-add", 
"Add new CD", 
NULL, GTKUSIGNAL_FUNC [on_addcd_activate), 
NULL, -1); 
gtk_toolbar_insert_space (GTK_TOOLBAR (toolbar), 1); 
gtk_toolbar_insert_stock (GTK_TOOLBAR (toolbar), 
*gtk-quit", 
"Quit the Application", 
NULL, GTK_SIGNAL_FUNC [on quit activate), 
NULL, -1); 


(7) 创建 用 于 搜索 CD 的 构件 : 


label = gtk_label_new(*Search String:*); 
entry = gtk_entry_new (); 
search button = gtk_button_new_with_label ("Search"); 


(8) gtk_scrolled_window 提 供 滚 动 条 ， 使 构件 《在 本 例 中 是 
GtkTreeView) 可 以 扩展 超出 窗口 的 大 小 : 


scrolledwindow = gtk_scrolled_window_new (NULL, NULL); 

gtk_scrolled_window_set_policy (GTK_SCROLLED_WINDOW (scrolledwindow), 
GTK_POLICY_AUTOMATIC, 
GTK_POLICY_AUTOMATIC) ; 


(9) BERR, BEE ABER A ae MPP OR BES Ft MEL 7 ze : 


vbox = gtk_vbox_new (FALSE, 0); 

hbox = gtk_hbox_new (FALSE, 0); 

gtk_box_pack_start (GTK_BOX (vbox), hbox, FALSE, FALSE, 5); 
gtk_box_pack_start (GTK_BOX {hbox), label, FALSE, FALSE, 5); 
gtk_box_pack_start (GTK_BOX (hbox), entry, TRUE, TRUE, 6); 
gtk_box_pack_start (GTK_BOX (hbox), search _button, FALSE, FALSE, 5); 
gtk_box_pack start (GTK_BOX (vbox), scrolledwindow, TRUE, TRUE, 0); 


(10) 然后 创建 GtkTreeView 构 件 ， 增 加 3 列 ， 并 将 其 放 在 
GtkScrolledWindow 中 : 


treeview = gtk_tree_view_new() ; 

renderer = gtk_cell_renderer_text_new [); 

gtk_tree_view_ insert column with attributes (GTK_TREE_VIEW(treeview), 
COLUMN_TITLE, 
"Title", renderer, 
"text", COLUMN_TITLE, 
NULL) ; 

gtk_tree_view_insert_column_with_attributes (GTK_TREE_VIEW(treeview), 
COLUMN_ARTIST, 
"Artist", renderer, 
"text", COLUMN_ARTIST. 
NULL} ; 

gtk_tree_view_insert_column_with_attributes (GTK_TREE_VIEW(treeview) , 
COLUMN_CATALOGUE, 
"Catalogue", renderer, 
"text", COLUMN_CATALOGUE, 


LELY : 
LL) ; 


gtk_tree_view_set_search_columi (GTK_TREE_VIEW (treeview), 
COLUMN_TITLE) ; 


gtk_container_add (GTK_CONTAINER (scrolledwindow), treeview); 


(11) 最 后 ， 设 定 主 窗口 的 内 容 ， 增 加 一 个 GnomeAppbar， 并 连接 


必要 的 回调 函数 : 


gnome_app_set_contents (GNOME_APP (app), vbox); 


appbhar = gnome_appbar_new (FALSE, TRUE, GNOME_PREFERENCES_NEVER) ; 
gnome_app_set_statusbar (GNOME_APP (app), appbar); 


gnome_app_install_menu_hints (GNOME_APP (app). menubar); 

g_signal_connect (GTK_OBJECT (search button}, "clicked", 
GTK_SIGNAL_FUNC (on_search_button_clicked) 
entry); 

g_signal connect (GTK_OBJECTiapp), *delete_event’, 
GTK_SIGNAL_FUNC ( delete_event_handler }, 
NULL} ; 


g_signal_connect (GTK_OBJECT(app), “destroy”, 
GTK_SIGNAL_FUNC ( quit_app ), NULL); 


return app; 


(12) 下 面 的 函数 创建 了 一 个 简单 的 对 话 框 ， 用 来 向 数据 库 中 添加 
er ere een es ee are 
AH: 


GtkWidget *create added dialog() 
{ 


artist_entry = gtk_entry_new(); 
title_entry = gtk_entry_new(); 
catalogue_entry = gtk_entry_new(); 


GtkWidget *dialog = gtk dialog _ new with buttons ("Add CD", 
app, 
GTK_DIALOG_DESTROY_WITH_PARENT, 
GTK_STOCK_OK, 
GTK_RESPONSE_ACCEPT, 
GTK_STOCK_CANCEL, 
GTK_RESPONSE_REJECT, 
NULL) ; 


ad widget with label ( GTK_CONTAINER (GTK_DIALOG (dialog) ->vbox), 
"Artist", artist_entry); 

add_widget_with label ( GTK_CONTAINER (GTK_DIALOG (dialog) ->vbox), 
"Title", title_entry); 

add_widget_with_ label | GTK_CONTAINER (GTK_DIALOG (dialog) ->vbox), 
"Catalogue", catalogue_entry) ; 


g_signal_connect { GTK_OBJECT (dialog), response", 
GTK_SIGNAL_FUNC (addcd_dialog_button_ clicked), NULL); 


return dialog; 


(13) 用 户 在 查询 数据 库 之 前 需要 先 登录 数据 库 。 下 面 这 个 函数 创 
建 一 个 对 话 框 ， 用 于 输入 用 户 名 和 和 密码 : 


实 验 callbacks.c 
文件 callbacks.c 包 含 用 于 UI 构件 的 回调 函数 定义 。 
(1) 首先 ， 需 要 包含 头 文 件 和 引用 一 些 在 interface.c 中 定义 的 全 局 
变量 ， JEFF HLT 以 读 取 和 更 改 某 些 构件 的 属性 了 : 


(2) 在 quit_app 中 ， 调 用 database_end 在 退出 前 做 清理 工作 并 关闭 
数据 库 : 


(3) 接 下 来 的 函数 弹出 一 个 简单 的 对 话 框 ， 用 于 确认 你 是 否 想 要 
退出 应 用 程序 ， 并 返回 一 人 eae tte 


gb a rm 
gint result 
kWidget j! G] age_dia 
"Ar 
re: Xur ALO i J 
t (di 


(4) delete_event_handler 是 一 个 与 主 窗口 的 Gdk 删 除 事 件 相连 接 的 
回调 函数 。 这 个 事件 在 你 试图 关闭 窗口 时 发 送 ， 但 它 位 于 GTK+destroy 
信号 发 出 之 前 。 


gboolean delete_event_handler GtkWidger 


(5) 下 一 个 函数 在 用 户 点 击 增加 CD 对 话 框 中 的 按钮 时 被 调用 。 如 


打点 击 了 OK 按钮 ， 程 序 将 字符 串 复 制 到 一 个 非 const 的 字符 数组 中 ， 并 
将 其 中 的 数据 传递 给 MySQL 的 接口 函数 add_cd: 


return !confirm_exit{); 


(5) F —7 eR REF CDS i EP Fe LI R.A eas ORF Hf 
复制 到 | r FTA. PEREP A SR DA MySQI ORAR EVER? 
void addcd_dialog button clicked (GtkDialog * dialog, gint response 
gpo serdata 
ons ha 
ons na 
ons ha gi st; 
cha tis 
cha t 
char cata 
3 a_i 
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(6) 这 是 整个 应 用 程序 的 核心 部 分 ;获取 搜索 结果 ， 并 填充 
GtkTree View. 


(7) 你 从 输入 框 构件 中 得 到 搜索 字符 串 ， 将 其 复制 到 一 个 非 const 
的 变量 中 ， 然 后 获取 匹配 CD 的 ID: 


(8) 接着 ， 更 新 appbar 来 显示 一 条 消息 ， 通 知 用 户 搜 索 结 果 : 


MAX_CD_RESULT search string); 


(9) 现在 你 得 到 了 搜索 结果 ， 可 以 用 它 来 填充 GtkTreeStore 了 。 对 
每 个 CD ”ID， 你 需要 获取 其 对 应 的 current_cd_st 结 构 〈( 这 个 结构 包含 了 
CD 的 标题 和 作曲 家 信息 〉， 然 后 获取 其 曲目 列表 。 还 要 限制 CD 条 目的 
总 数 不 超 过 app_mysql.h 中 定义 的 MAX_CD_RESULT 值 ， 来 确保 
GtkTreeStore 不 会 溢出 。 


res2 = get_cd(cd_res.cd_id[i], &¢d); 


/* Add a new row to the model */ 

gtk_tree_store_append (tree_store, &parent_iter, NULL); 

gtk_tree_store_set (tree_store, &parent_iter, 
COLUMN_TITLE, cd.citle, 
COLUMN_ARTIST, cd.artist_name, 
COLUMN_CATALOGUE, cd.catalogue, -1 
Mi 


res} = get_cd_tracks(cd_res.cd_id[i++], ket); 
j= 0; 
/* Populate the tree with the current cd's tracks */ 
while (j < res3) 
( 

sprintf(track_title, * Track $d. *, j+1); 
streat(track_title, ct.track[j++]); 


gtk_tree_store_append (tree_store, &child_iter, &parent iter); 
gtk_tree_store_set (tree_store, &child_iter, 
COLUMN_TITLE, track title, -1); 
) 
} 


gtk_tree_view_set_model (GTK_TREE_VIEW (treeview), GTK_TREE_MODEL[tree_store))}; 


(10) addcd 对 话 框 是 非 模式 的 。 因 此 ， 你 需要 在 创建 和 显示 它 之 


前 先 检查 它 是 否 已 存在 : 


void on_addcd_activate (GtkMenulItem * menuitem, gpointer user_data) 
{ 
if (addcd_dialog != NULL) 
return; 


added dialog = create_addcd_dialog|); 
gtk_widget_show_all (addced_dialog); 


} 


gboolean close_app | GtkWidget * window, gpointer date) 
{ 


gboolean exit; 


if ((exit = confirm_exit())) 
{ 
quit_app (NULL, NULL); 


return exit; 


(11) 当 点 击 About 按 钮 时 ， 一 个 标准 的 GNOME about 
口 将 弹出 : 


void on_about_activate (GtkMenultem * menuitem, gpointer user_data} 
Tt 


const char * authors(|] = ("Wrox Press", NULL); 

GtkWidget *about = qnome_about_new (*CD Database", *1.0°, 
*(c) Wrox Press*, 
“Beginning Linux Programming", 
(const char ** } authors, NULL, 


*Translators*, NULL); 
gtk_widget_show(about) ; 
) 


(关于 ) 窗 


1 


实 验 main.c 
输入 下 面 代码 ， 将 它 命 名 为 main.c， 它 包含 这 个 程序 的 main 函 数 。 
(1) 在 include 语 句 之 后 ， 你 引用 在 interface.c 中 定义 的 用 户 名 和 密 


码 输入 构件 : 


(2) 像 通常 一 样 初始 化 GNOME 库 ， 然 后 创建 并 显示 主 窗口 和 登录 
对 话 框 : 


(3) 程序 不 断 循环 ， 直 到 用 户 输入 了 一 个 正确 的 用 户 名 和 密码 。 
用 户 可 以 通过 点 击 Cancel 按 钮 退出 ， 此 时 程序 会 询问 他 是 售 确 认 这 个 操 
作 。 


(4) 如 果 database _start 失 败 ， 它 将 显示 一 条 错误 信息 ， 并 重新 显示 


登录 对 话 框 : 


GtkWidget * error_dialog = gtk_message_dialog_new (GTK_WINDOW(main_ window), 


(5) 你 将 编写 一 个 makefile 文 件 来 编译 这 个 应 用 程序 。 和 第 8 章 中 
一 样 ， 你 可 能 需要 添加 mysqlclient 库 的 路 径 ， 如 下 所 示 : 
-L/usr/lib/mysql 
在 -L 之 后 指定 你 的 系统 中 放置 MySQL 库 的 目录 。 


app: app_mysql.c callbacks.c interface.c main.c app_gnome.h app_mysql.h 


gece -o app ~-I/usr/include/mysql app_mysql.c callbacks.c interface.c main.c ~ 
lmyegiclient ‘pkg-config cflags --libs libgnome-2.0 libgmomeui-2.0 
clean: 

rm -f app 


(6) 现在 只 需 使 用 make 命 令 来 编译 这 个 CD 应 用 程序 即 可 : 
make -f Makefile 
运行 app， 你 将 会 看 到 一 个 GNOME 风 格 的 CD 应 用 程序 (如 图 16- 
15) 。 


CD Database 


Add Qut 
Search String: Wink 


Tle Artist Catalogue 

» Dark Side of the Moon Pink Floyd 6000024D4P 

v Wish You Were Here Pink Floyd 8000024045 
Wack 1. Shine on you crazy damond 


Track 2. Welcome to the machine 


Wack 3. Have ə cigar 
Wack 4. Wish you were here 
Wack 5. Shine on you crazy amond pt.2 


Displaying 2 result(s) for search string ' Pink" 


图 16-15 


16.10 ”小结 


在 本 章 中 ， 你 学 习 了 如 何 用 GTK+/GNOME 库 来 编写 具有 专业 界面 
外 观 的 GUI 应 用 程序 。 首 先 ， 你 了 解 了 X 视 窗 系统 以 及 工具 包 是 如 何 与 
之 相 适 应 的 ， 然 后 简要 了 解 了 GTK+ 及 其 对 象 系统 和 信和 号 /回调 函数 机 制 
是 如 何 运作 的 。 

接着 ， 你 开始 学 习 GTK+ 构 件 的 API 函 数 ， 我 们 通过 一 些 程序 展示 
了 其 或 简单 或 高 级 的 实际 使 用 情况 。 在 学 习 GnomeApp 构 件 时 ， 你 看 到 
通过 辅助 宏 创建 菜单 是 多 么 容易 。 最 后 ， 你 学 习 了 如 何 创 建 模 式 和 非 模 
式 对 话 框 来 与 用 户 进 行 交 互 。 

在 本 章 的 最 后 ， 你 为 CD 数据 库 创 建 了 一 个 GNOME/GTK+ 的 GUI， 
你 可 以 通过 它 登录 数据 库 、 搜 索 CD， 以 及 向 数据 库 中 增加 CD。 

在 第 17 章 中 ， 你 将 看 到 GTK+ 的 竞争 者 Qt， 并 学 习 如 何 使 用 Qt 来 编 
写 KDE 程 序 。 


第 17 章 ”用 Qt 井 行 KDE 编 程 


在 第 16 音 中 ， 你 学 习 了 在 X 环 境 下 使 用 GNOME/GTK+GUI 库 来 创 
建 图 形 用 户 界 面 。 但 并 非 只 能 使 用 那些 库 来 开发 GUI，Linux 的 GUI 领域 
中 的 另 一 大 主角 是 KDE/Qt。 在 本 章 中 ， 你 将 会 学 习 这 些 库 ， 并 看 到 它 
们 是 怎样 在 与 GNOME/GTK+ 的 竞争 中 发 展 的 。 

Qt 是 用 C++ 语言 编写 的 ，C++ 也 是 编写 QUKDE 程 序 的 标准 语言 。 
此 在 本 章 中 ， 你 必须 把 注意 力 从 你 熟悉 的 C 语 言 转移 到 C++ 语言 上 来 。 
你 也 可 借 此 机 会 重 温 一 下 C++ 语言 ， 特 别 是 回顾 一 下 派生 、 封 装 、 方 法 
重 载 和 虚 函 数 的 基本 原理 。 

本 章 我 们 将 介绍 以 下 内 容 : 

Qt 简介 

安装 Qt 

开始 编程 

信号 / 槽 机制 

Qt 构件 

Qt 对 话 框 

KDE ae FASE A AE 

使 用 KDE/Qt 创 建 CD 数 据 库 应 用 程序 


口 口 口 口 口 口 口 口 


17.1 KDE# Qt st 


KDE (KEMA) 是 一 个 基于 Qt GUI 库 的 开源 桌面 环境 。KDE 中 
包含 了 大 量 的 应 用 程序 和 工具 ， 其 中 包括 一 整套 办 公 套 件 、 一 个 Web 浏 
览 器 ， 甚 至 还 有 一 个 功能 齐全 的 KDE/Qt 应 用 程序 集成 开发 环境 〈 即 在 
第 9 章 中 介绍 的 KDevelop) 。 当 苹果 公司 选用 KDE 的 Web 浏 览 器 作为 
Mac OS X 的 主要 Web 浏 览 右 Safari (被 认为 是 最 快速 的 浏览 器 〉 的 核心 
时 ， 业 界 才 发 现 KDE 的 程序 有 多 先进 。 

KDE 项 目的 主页 是 http://www.kde.org， 在 那里 你 可 以 了 解 它 的 更 多 
信息 、 下 载 KDE 和 KDE 应 用 程序 、 查 找 文 档 、 加 入 邮件 列表 ， 以 及 了 解 
其 他 开发 者 的 信息 。 


在 写作 本 书 时 ，KDE 的 最 新 版 本 是 3.5.7。 因 为 这 是 当前 Linux 
发 行 版 自 带 的 版 本 ， 所 以 我 们 将 假设 你 已 经 安装 了 KDE 3.5 或 者 更 
高 的 版 本 。 目 前 ， 开 发 人 员 正 在 开发 KDE 的 一 个 主要 升级 版 本 
KDE4.0。 你 也 可 以 下 载 KDE4.0 的 预览 版 。 同 样 地 ，Qt 的 最 新 版 本 
是 4.3， 但 大 多 数 Linux 发 行 版 自 融 的 版 本 是 Qt3， 如 Qt3.3。 本 章 将 
介绍 QT3.3， 因 为 它 是 目前 最 常见 的 一 个 版 本 。 


从 程序 员 的 角度 来 看 ，KDE 提 供 了 许多 KDE 构 件 ， 这 些 构件 通常 来 
源 于 伴随 它们 的 Qt， 但 相 比 功能 增强 了 并 且 也 更 易 使 用 了 。 与 单独 使 用 
J KDE 构 件 提 供 了 与 KDE 桌 面 更 好 的 集成 。 例 如 ， 你 可 以 进行 会 
话 管 理 。 

Qt 是 一 个 用 C++ 编 写 的 、 成 熟 的 、 跨 平台 的 GUI 工 具 包 。 它 是 挪威 
Trolltech 公 司 的 产品 ， 该 公司 为 商业 市 场 开 发 、 销 售 和 支持 Qt 及 Qt 相关 
软件 。Trolltech 着 力 大 肆 宣 传 Qt 的 跨 平 台 能 力 ， 这 个 能 力 的 确 令 人 印象 
深刻 。Qt 本 身 就 支持 Linux 和 类 UNIX 系 统 、Windows、Mac OS X, H2 
RADE A, EQUALS PFN AFCA. 


Qt 有 一 个 可 以 在 手机 上 运行 的 专用 版 本 。 它 的 男 一 个 版 本 可 以 
运行 在 Sharp Zaurus PDA 和 类 似 的 平台 上 。Qt Jambi 还 提供 了 该 工 
具 包 的 一 个 Java 版 本 。 


Trolltech 公 司 目前 以 一 个 对 临时 用 户 和 爱好 者 来 说 非常 高 的 价格 在 
销售 Qt 的 商业 版 本 。 但 值得 庆幸 的 是 ，Trolltech 公 司 意 识 到 了 为 目 由 软 
件 社 区 提供 一 个 免费 版 本 的 价值 。 因 此 ， 它 提供 了 一 个 支持 Linux、 


Windows 和 Mac OS XQ. Atk, Trolltech2s 4] th mtg A 
庞大 的 用 户 群 、 一 个 大 型 的 程序 员 社 区 和 对 其 产品 的 高 度 认 可 。 

Qt 开源 版 本 遵循 GPL 许 可 证 ， 这 意味 着 你 可 以 用 Qt 库 编写 程序 ， 并 
且 免 费 发 布 自 己 的 GPL 软件 。 据 我 们 所 知 ，Qt 开 源 版 本 与 Qt 专业 版 本 之 
间 的 两 个 主要 区 别 是 : 前 者 缺乏 文 持 以 及 你 不 能 在 商业 应 用 程序 中 使 用 
Qt 软件 。Trolltech 的 网 站 http://wwwi.trolltech.com 上 有 你 需要 的 所 有 API 
文档 。 


17.2 ”安装 Qt 


除非 你 有 特殊 的 原因 需要 从 源 代 码 开 始 编译 ， 人 否则 最 好 直接 找 一 个 
针对 你 的 Linux 发 行 版 的 二 进 制 软件 包 或 RPM 包 来 安装 Qt。Fedora Linux 
7 自 带 了 qt-3.3.8-4.i386.rpm， 你 可 以 用 下 面 的 命令 来 安装 它 : 

$ rpm -Uvh qt-3.3.8-4.i386.rpm 

你 也 可 以 用 软件 包 管 理 器 来 安装 Qt 和 KDE 编 程 床 〈 见 图 17-1) 。 


® 
Be Yew heb 
[eg Browse Q Search | 汪 Lst 


a Sa = 
Desktop Environments € ¥ GNOME Software Development ` | 
Applications © Java Development 
I zu KDE Software Development 


Servers n 
Legacy Software Development 
Base System ~ PE - 


instal these packages to develop QT and KOE graphical or ations 


vV apply 


图 17-1 


如 果 想 自己 下 载 源 代码 并 编译 Qt， 你 可 以 从 Trolltech 公 司 的 FTP 站 
点 ftp://ftp.trolltech.com/qt/source/ 下 载 最 新 的 源 代码 包 。tar 软 件 包 中 的 
INSTALL 文 件 详细 说 明了 如 何 编译 和 安装 Qt: 


$ cd /usr/local 
$ tar -xvzf qt-xll-free-3.3.8.tar.gz 


$ ./configure 
5 make 


你 还 需要 在 /etc/ld.so.conf 文 件 中 添加 如 下 一 行 ( 该 行 可 以 添加 在 这 
个 文件 中 的 任何 位 置 ) : 
/usr/lib/qt-3.3/lib 


在 Fedora 和 Red Hat ” Linux 系统 中 ， 这 行内 容 是 保存 在 文 
件 /etcld.so.conf.d/qt-i386.conf. 中 的 。 如 果 你 是 按 图 17-1 所 示 的 方式 


安装 的 Qt， 那 么 这 一 步骤 可 以 省 略 ， 因 为 系统 已 经 帮 你 做 好 了 。 
在 安装 好 Qt 后 ， 环 境 变量 QTDIR 应 被 设置 为 Qt 的 安装 目录 。 你 可 以 
用 如 下 命令 进行 检查 : 
$ echo $QTDIR 
/usr/lib/qt-3.3 
同时 ， 要 确认 jb 目录 已 被 添加 到 /etcld.so.conf 文 件 中 。 
接 下 来 以 超级 用 户 的 身份 运行 如 下 命令 : 
# ldconfig 
Te 尝试 运行 下 面 这 个 最 简单 的 Qt 程序 ， 以 确保 你 的 Qt 安装 能 够 正 
党 


实 验 QMainWindow 
输入 这 个 程序 〈 或 对 下 载 的 代码 进行 复制 、 粘 贴 ) ， 将 其 命名 为 


qtl.cpp: 
include <gapplication.h> 
#include <qmainwindow.h> 


要 编译 这 个 程序 ， 你 需要 包含 Qt 的 include 和 ]ib 目 录 : 
$ g++ -o qtl qtl.cpp -ISQTDIR/include -LS$QTDIR/lib -lqui 


F 面 命令 最 后 的 库 是 -1qt。 不 过 对 Qt3.3 来 说 ， 


在 某 些 平台 上 ， 
应 使 用 -lqui。 


运行 这 个 程序 ， 你 将 看 到 一 个 Qt 窗口 〈 见 图 17-2) 。 
S alati 


图 17-2 


实验 解析 

与 GTK+ 不 同 ，Qt 中 没有 一 个 涵盖 一 切 的 qth 头 文件 ， 因 此 你 必须 明 
确 包 含 对 应 每 个 你 所 使 用 对 象 的 头 文件 。 

你 遇 到 的 第 一 个 对 象 是 QApplication。 这 是 必须 构造 的 主 Qt 对 象 ， 
你 将 命令 行 参数 传递 给 它 。 每 个 Qt 应 用 程序 必须 有 且 仅 有 一 个 
QApplication 对 象 ， 而 且 你 必须 在 做 其 他 任何 事 之 前 创建 它 。 
QApplication 人 负责 处 理 一 些 底 层 操 作 ， 如 事件 处 理 、 字 符 串 本 地 化 和 控 
制 界面 外 观 等 。 

上 述 使 用 了 两 个 QApplication 的 方法 : 一 个 是 setMainWidget， 它 设 
置 应 用 程序 的 主 构件 ， 另 一 个 是 exec， 它 启动 事件 循环 。exec 将 一 直 运 
行 ， 直 到 QApplication::quitO 被 调用 或 主 构 件 被 关闭 。 

QMainWindow 是 一 个 Qt 基础 窗口 构件 ， 它 支持 菜单 、 工 具 栏 和 状 
态 栏 。 本 章 会 详细 讲述 如 何 扩 展 它 ， 以 及 为 其 添加 构件 以 创建 一 个 用 户 


面 。 
接 下 来 ， 我 们 将 介绍 事件 驱动 编程 的 机 制 ， 你 将 为 应 用 程序 添加 一 
个 PushButton 构 件 。 


17.3 (8-5 Fh 


正如 你 在 第 16 章 中 所 看 到 的 ， 信 和 号 和 信号 处 理 是 GUI 应 用 程序 用 来 
响应 用 户 输入 的 主要 机 制 ， 也 是 所 有 GUI 库 的 核心 特征 。Qt 的 信号 处 理 
机 制 由 信号 〈signal) 和 槽 “slot) 构成 ， 它 们 相当 于 GTK+ 中 的 信号 和 
回调 函数 ， 或 者 Java 中 的 事件 和 事件 句柄 。 


注意 ，Qt 信 号 与 第 11 章 中 讨论 的 UNIX 信 号 是 完全 不 同 的 两 个 
概念 。 


这 里 再 回顾 一 下 事件 驱动 编程 的 原理 : AGUEA TH 
兰 、 按 钮 、 输 入 框 和 许多 其 他 GUI 元 素 组 成 的 ， 这 些 元 素 被 统称 为 构 
件 。 当 用 户 与 一 个 构件 交互 时 ， 例 如 激活 全 单项 或 者 在 输入 框 中 输入 一 
些 文本 ， 构 件 将 发 出 一 个 命名 信和 号， 如 clicked、text_changed 或 
key_pressed。 你 通常 要 对 用 户 的 动作 做 出 啊 应 ， 例 如 保存 一 个 文档 或 退 
出 应 用 程序 。 你 通过 把 一 个 信号 连接 到 一 个 回调 函数 〈 在 Qt 的 说 法 中 ， 
是 一 个 槽 ) 来 做 到 这 一 点 。 

在 Qt 中 使 用 信号 和 槽 的 方法 比较 特别 ，Qt 定 义 了 两 个 新 的 很 贴切 的 
伪 关 键 字 (signals 和 slots，， 它 用 这 两 个 伪 关 键 字 来 标识 代码 中 类 的 信 
号 和 槽 。 这 非常 有 利于 增强 代码 的 可 读 性 和 可 维护 性 ， 但 它 也 意味 着 ， 
代码 必须 经 过 一 个 单独 的 预 一 预 处 理 阶 段 (pre-pre processing) ， 来 搜 
索 这 些 伪 关键 字 并 用 额外 的 C++ 代码 对 它们 进行 蔡 换 。 


因此 ，Qt 代 码 并 不 是 真正 的 C++ 代码 。 这 有 了 时候 对 某 些 开 发 人 
员 来 说 是 一 个 问题 。http://doc.trolltech.com/ 上 的 Qt 文档 中 包含 了 使 
用 这 些 新 的 念 C++ 关键 字 的 原因 。 此 外 ， 信 号 和 槽 的 使 用 与 
Windows 中 的 微软 基础 类 或 MFC 并 没有 什么 不 同 ， 后 者 也 使 用 了 一 
个 C++ 语言 的 修改 定义 。 


Qt 中 信号 和 槽 的 使 用 有 一 些 限 制 ， 但 这 些 限制 不 是 太 严 重 。 
信号 和 槽 必须 是 QObject 的 派生 类 的 成 员 函 数 。 

如 果 使 用 多 重 继承 ，QObject 必 须 在 类 列表 中 第 一 个 出 现 。 
在 类 声明 中 必须 出 现 Q_OBJECT 语 句 。 

信号 不 能 在 模板 中 使 用 。 

函数 指针 不 能 用 作 信 号 和 覃 的 参数 。 

信号 和 槽 不 能 被 履 写 和 提升 为 公共 (public) 方法 。 


Tk 


OOOOOd 


因为 你 需要 在 QObject 的 派生 类 中 编写 信号 和 槽 ， 而 且 Qt 基 础 构件 
QWidget 派 生 自 QObject， 所 以 通过 扩展 和 定制 构件 来 创建 界面 是 合 情 合 
ett 你 几乎 都 是 通过 扩展 如 QMainWindow 这 样 的 构件 来 创 
建 界面 。 
一 个 典型 的 针对 GUI 的 类 定义 MyWindow.h 如 下 所 示 : 


Virtual 


该 类 继承 自 QMainWindow， 它 为 应 用 程序 中 的 主 窗口 提供 功能 。 
类 似 地 ， 当 需要 一 个 对 话 框 时 ， 你 将 创建 一 个 QDialog 的 子 类 。 类 声明 
的 第 一 条 语句 是 Q_OBJECT， 它 充当 一 个 预 处 理 右 标记 ， 接 下 来 就 是 通 
第 的 构造 函数 和 析 构 函数 原型 ， 然 后 是 信号 和 模 的 定义 。 

你 有 一 个 信号 和 一 个 槽 ， 二 者 均 无 参数 。 要 发 出 一 个 信号 ， 你 只 需 
在 代码 的 某 处 调用 emit: 


emit aSignal(); 


也 就 是 说 ， 其 他 的 所 有 事情 都 是 由 Qt 来 处 理 ， 你 甚至 不 需要 提供 一 
个 aSignal O 的 实现 。 

要 使 用 槽 ， 你 必须 将 它们 连接 到 一 个 信号 。 这 是 通过 QObject 类 中 
的 静态 方法 connect 来 完成 的 : 


bool QObject::connect (const QObject * sender, const char * signal, 
const QObject * receiver, const char * member) 


你 只 需 传 递 4 个 参数 : 拥有 信号 的 对 象 〈 发 送 者 ) 、 信 号 函数 、 拥 
有 槽 的 对 象 ( 接 收 者 ) 、 槽 的 名 字 。 

在 上 面 的 MyWindow 例 子 中 ， 如 果 想 把 QPushButton 构 件 的 clicked 信 
号 连接 到 doSomething 槽 ， 你 可 以 这 样 写 : 


SIGNAL (< 8 OT (doSe 


注意 ， 你 必须 用 SIGNAL 和 SLOT 宏 来 包围 信号 和 覃 函数 。 与 
GTK+ 类 似 ， 一 个 给 定 信 号 可 以 连接 任意 数目 的 模 ， 一 个 槽 也 可 以 连接 
任意 数目 的 信号 ， 只 要 多 次 调用 connect 方 法 即 可 。 如 果 连 接 失 败 ， 它 将 
返回 FALSE。 

剩 下 的 事 就 是 实现 模 函 数 ， 它 采用 的 是 一 个 普通 成 员 函 数 的 形式 : 


void MyWindow: :doSomething() 
{ 


Siot code 
) 


实 验 信号 和 横 

你 已 经 了 解 了 信号 和 权 的 工作 原理 ， 现 在 通过 一 个 例子 来 使 用 它 
们 。 扩 展 QMainWindow 并 增加 一 个 按钮 ， 然 后 把 按钮 的 clicked 信 号 连接 
到 一 个 村。 

(1) 输入 下 面 的 类 声明 ， 把 它 命名 为 ButtonWindow.h: 


Sinclude <qmainwindow.h> 


class ButtonWindow : public QMainwindow 
Q_ OBJECT 
public: 
ButtonWindow(QWidget *parent = 0, const char ‘name = 0); 


virtual ~ButtonWindow() ; 


private slots: 
void Clicked(); 


(2) 接 下 来 是 类 的 实现 ButtonWindow.cpp: 


finclude "ButtonWindow.moc’ 
#include <qpushbutton.h> 
finclude <gapplication.h> 
Sinclude <iostream> 


(3) 在 构造 函数 中 ， 你 设置 窗口 标题 ， 创 建 按钮 ， 并 且 把 按钮 的 
clicked 信 号 连接 到 槽 。setCaption 是 QMainWindow 中 设置 窗口 标题 的 方 
法 : 


ButtonWindow: :ButtonWindow(QWidget "parent, const char *name) 
: QMainWindow(parent, name) 


this->setCaption("This is the window Title"); 

QPushSutton *button = new QPushButton("Click Me!*, this, *Buttonl"); 
button->setGeometry(50,30,70,20); 

consect (button, SIGNAL(clicked()), this, SLOT(Clicked[})); 


(4) Qt 目 动 管理 构件 的 析 构 函数 ， 所 以 你 的 析 构 函数 是 空 的 : 


ButtonWindow: :~ButtonWindow() 
{ 
} 


(5) 接 下 来 是 槽 的 实现 代码 : 


void ButtonWindow: :Clicked(void) 
{ 

std::cout << *clicked!\n*; 
) 


(6) 最后， 在 main 函 数 中 ， 你 只 创建 了 ButtonWindow 的 一 个 实 
例 ， 把 它 设置 成 应 用 程序 的 主 窗口 ， 然 后 在 屏幕 上 显示 它 : 


QApplication applargc, argv); 


ButtonWindew *window = new ButtonWindow(); 


(7) 在 编 详 这 个 例子 之 前 ， 你 需要 对 头 文件 运行 预 处 理 程序 。 这 
个 预 处 理 程序 被 称 为 元 对 象 编译 器 (moc) ， 它 位 于 Qt 软件 包 中 。 在 
ButtonWindow.h 上 运行 moc， 将 输出 结果 保存 为 ButtonWindow.moc: 
$ moc ButtonWindow.h -o ButtonWindow.moc 


现在 你 可 以 像 往常 那样 编译 程序 了 ， 将 moc 的 输出 链接 进来 : 
$ g++ -o button ButtonWindow.cpp -I$QTDIR/include -L$QTDIR/lib -lqui 

运行 该 程序 ， 你 将 看 到 如 图 17-3 所 示 的 内 容 。 
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图 17-3 


实验 解析 

我 们 在 这 里 引入 了 一 个 新 的 构件 和 一 些 新 函数 ， 下 面 就 对 它们 分 别 
进行 介绍 。QPushButton 是 一 个 简单 的 按钮 构件 ， 它 有 一 个 标签 和 位 
图 ， 用 户 可 以 通过 使 用 鼠标 点 击 或 按键 盘 来 激活 它 。 

QPushButton 的 构造 函数 很 简单 ; 


第 一 个 参数 是 按钮 标签 的 文本 ， 第 二 个 是 父 构 件 ， 最 后 一 个 是 由 Qt 
在 其 内 部 使 用 的 按钮 名 字 。 

parent 参 数 是 所 有 QWidget 都 有 的 参数 ， 父 构件 控制 该 构件 什么 时 候 
显示 和 销毁 ， 以 及 其 他 各 种 特性 。 传 递 NULL 给 parent 参 数 表示 该 构件 是 
顶层 构件 ，Qt 将 创建 一 个 空白 窗口 来 包含 它 。 在 本 例 中 ， 你 使 用 this 为 
parent 参 数 传 递 了 当前 的 ButtonWindow 对 象 ， 这 将 把 这 个 按钮 添加 到 
ButtonWindow 主 区 域 中 。 

name 参 数 设置 构件 在 Qt 内 部 使 用 的 名 字 。 如 果 Qt 遇 到 错误 ， 则 该 名 
字 会 显示 在 输出 的 错误 信息 中 ， 因 此 你 应 该 选择 一 个 合适 的 构件 名 字 ， 
这 样 可 以 在 调试 时 节省 大 量 时 间 。 

你 可 能 已 注意 到 ， 程 序 只 是 很 随便 地 通过 设置 QPushButton 构 造 函 
数 的 parent 参 数 ， 将 QPushButton 添 加 到 ButtonWindow 中 。 它 没有 指定 构 
件 的 位 置 、 大 小 、 边 界 或 其 他 类 似 的 属性 。 如 果 想 精确 控制 构件 的 布局 

(这 对 创建 一 个 有 了 吸引 力 的 用 户 界面 很 关键 ，， 你 束 必 须 使 用 Qt 的 布局 
对 象 。 下 面 就 让 我 们 来 看 看 它 。 

Qt 中 有 很 多 种 方法 可 以 用 来 排列 构件 的 位 置 和 布局 。 你 已 经 看 到 可 
以 通过 调用 setGeometry 来 设置 绝对 坐标 ， 但 这 很 少 使 用 。 因 为 当 调 整 窗 
口 大 小 时 ， 构 件 不 会 做 相应 地 调整 来 适应 窗口 。 

排列 构件 的 首选 方法 是 使 用 QLayout 类 或 Box 构 件 ， 在 你 给 出 构件 
的 边 距 值 和 构件 间 的 间距 值 后 ， 它 们 会 根据 情况 自动 调整 大 小 。 

QLayout 类 和 Box 构 件 之 间 的 主要 不 同 是 : 布局 对 象 不 是 构件 。 

布局 类 派生 自 QObject 而 不 是 QWidget， 因 此 你 在 使 用 它 时 受到 一 些 
限制 。 比 如 ， 你 不 能 将 QVBoxLayout 作 为 QMainWindow 的 中 心 构件 。 

与 布局 类 相反 ，Box 构 件 〈( 如 QHBox 和 QVBox) 派生 自 QWidget， 
因此 你 可 以 把 它们 看 做 为 普通 的 构件 。 你 可 能 会 奇怪 为 什么 Qt 同时 有 
QLayout 和 QBox 且 两 者 具有 重复 的 功能 。 其 实 QBox 构 件 只 是 为 了 方 
便 ， 本 质 上 和 它 是 在 一 个 QWidget 中 包含 了 一 个 QLayout。QLayout 共 备 自 
动 调整 大 小 的 优势 ， 而 构件 则 必须 通过 调用 QWidget: : resizeEvent() 来 
手工 调整 大 小 。 

QLayout 的 子 类 QVBoxLayout 和 QHBoxLayout 是 创建 界面 最 常用 到 
的 方法 ， 也 是 你 在 Qt 代码 中 最 常见 的 类 。 

QVBoxLayout 和 QHBoxLayout 都 是 不 可 见 的 容 嚣 对象， 它们 分 别 以 
垂直 和 水 平 的 方向 包含 其 他 构件 和 布局 。 你 可 以 创建 一 个 任意 复杂 的 构 
件 排列 ， 因 为 你 可 以 对 布局 进行 众 套 。 例 如 ， 将 一 个 横 癌 布局 作为 一 个 
元 了 素 放置 到 一 个 纵 同 布局 中 。 

下 面 是 我 们 感 兴趣 的 3 个 QVBoxLayout 构 造 函 数 (QHBoxLayout 有 


相似 的 API) : 


QVBoxLayout::QVBoxLayout (QWidget *parent, int margin, int spacing, const char 
*name) 

QVBoxLayout::QVBoxLayout (QLayout *parentLayout, int spacing, const char * name) 

QVBoxLayout: :QVBoxLayout (int spacing, const char *name) 


QLayout 的 parent 参 数 可 以 是 一 个 构件 或 是 另 一 个 QLayout。 如 采 没 
有 指定 parent， 那 么 你 以 后 只 能 通过 addLayonut 方 法 把 这 个 布局 加 到 另外 
一 个 QLayout 中 去 。 

margin 利 spacing 设 置 围绕 在 QLayout 四 周 的 边 距 和 构件 间 的 间隔 的 
像素 值 。 

一 旦 创建 了 QLayout 对 象 ， 你 就 可 以 用 下 面 两 个 方法 分 别 添加 子 构 
件 和 布局 : 


QBoxLayout::addWidget (QWidget *widget, int stretch = 0, int alignment = 0 ) 
QBoxLayout::addLayout (QLayout *layout, int stretch = 0) 


X w 使 用 QBoxLayout 类 
在 本 例 中 ， 你 通过 在 QMainWindow 中 安排 一 个 QLable 构 件 来 了 解 
QBoxLayout 类 的 实际 使 用 情况 。 
(1) 首先 ， 编 号 头 文件 LayoutWindow.h: 


include <qmainwindow.h> 


class LayoutWindow : public QMainwWindow 


WWidge 
ayoutWindow 


(2) 然后 ， 编 写 类 的 实现 文件 LayoutWindow.cpp: 


tinclude <qapp 


pyoutWindow: :LayoutWindow(QWidget *parent 


(3) 你 需要 创建 一 个 哑 QWidget 来 容纳 QHBoxLayout， 这 是 因为 你 
不 能 在 QMainWindow 中 直接 增加 QLayout: 


) 


QWidget *widget = new QWidget (this); 
setCentralWidget (widget) ; 


QHBoxLayout *horizontal = new QHBoxLayout (widget, 5, 10, *horizontal"); 
QVBoxLayout “vertical = new QOVBoxLayout(); 


QLabel* labell = new QLabel(*Top™, widget, “textLabell* ); 
QLabel* label2 = new Qlabel(*Bottom’, widget, “textLabel2"); 
QLabel* label3 = new Qlabel("Right", widget, ‘textLabel3*); 


vertical->addwWidget (labell); 
vertical->addwidget (label2); 
horizontal ->addLayout (vertical); 
horizontal->addwWidger (label3); 
resize{ 150, 100 }; 


LayoutWindow: :-~LayoutWindow() 


) 


int main{int arge, char **argv) 


( 


U? 


QApplication app largc, argv); 
LayoutWindow *window = new LayoutWindow(}; 


app. setMainwidget (window) ; 
window->show(}; 


return app.exec(); 


像 前 面 一 样 ， 你 需要 在 编译 之 前 在 头 文件 上 运行 moc: 
moc LayoutWindow.h -o LayoutWindow.moc 
g++ -o layout LayoutWindow.cpp -ISQTDIR/include -L$QTDIR/1ib -lqui 


运行 这 个 程序 ， 你 将 看 到 几 个 QLabel 的 位 置 被 安排 好 了 〔 见 图 17- 


4) 。 试 着 改变 窗口 的 大 小 ， 看 看 标签 怎样 根据 窗口 的 大 小 放大 和 缩 


小 。 


于 Layouts OX 


Top 


Right 


Rattam 
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实验 解析 

LayoutWindow.cpp 的 代码 创建 了 两 个 盒 布局 构件 用 于 放置 构件 ， 分 
别 是 横 癌 盒 布 局 构件 和 纵 同 盒 布局 构件 。 纵 癌 盒 布局 放置 了 两 个 标签 ， 
分 别 为 Top 和 Bottom。 横 问 盒 布局 也 放置 了 两 个 构件 ， 一 个 是 显示 为 
Right 的 标签 ， 男 一 个 是 纵 同 盒 布 局 构件 。 你 可 以 像 本 例 中 那样 ， 随 意 
地 在 一 个 布局 构件 中 放置 另 一 个 布局 构件 。 

你 可 以 尝试 修 改 LayoutWindow.cpp 中 的 代码 ， 以 便 更 好 地 了 解 盒 
Fea VE BE 

我 们 已 经 介绍 了 Qt 的 基本 概念 言 号 和 槽 、moc 和 布局 。 现 在 是 
时 候 进 一 步 讨 论 各 个 构件 了 。 


17.4 ”Qt 构件 


Qt 中 有 针对 各 种 用 途 的 构件 ， 如 果 全 部 讨论 就 会 占用 很 大 的 篇 幅 。 
在 本 市 中 ， 你 将 看 到 一 些 常 见 的 Qt 构件 ， 包 括 : 数据 输入 构件 、 按 钮 、 
组 合 框 和 列表 构件 。 


17.4.1 QLineEdit 


QLineEdit 是 Qt 的 单行 文本 输入 构件 。 你 可 以 用 它 来 输入 简短 的 文 
本 ， 如 用 户 的 名 字 。 在 使 用 该 构件 时 ， 你 可 以 使 用 一 个 输入 捧 码 来 限制 
输入 以 符合 模板 的 要 求 ， 或 者 为 了 实现 最 终 控制 ， 你 可 以 应 用 一 个 验证 
函数 《〈 例 如 ， 为 了 确保 用 户 输入 一 个 正确 的 日 期 、 电 话 号 码 或 其 他 类 似 
的 值 ) 。QLineEdit 具 有 编辑 特性 ， 它 允许 你 从 一 个 用 户 的 角度 或 是 使 
用 API 的 角度 来 选择 部 分 文本 、 剪 切 和 粘贴 、 撤 销 、 重 做 等 。 

它 的 构造 函数 和 最 有 用 的 方法 有 : 


#include <qlineedit .hy> 


QLineEdit::QlineEdit (QWidget *parent, const char* name = 0 ) 
QLineEdit::QLineEdit (const QString &contents, QWidget *parent, 
const char *name = 0 ) 
QLineEdit::QLineEdit (const QString &contents, const QString é&inputMask, 
QWidget "parent, const char *name = 0 ) 


void setInputMask (const QString &inputMask) 
void insert (const QString &newText ) 

bool isModified (void) 

void setMaxLength (int length) 

void setReadOnly (bool read) 

void setText (const QString &text) 


QString text (void) 
void setEchoMode(EchoMode mode) 


EERROR, URE E — FEEL ES Bparent#lnamek we E CPA 
和 构件 名 。 一 个 有 趣 的 属性 是 EchoMode， 它 决定 文本 在 构件 中 的 显示 


Wa us 
它 可 以 取 下 面 3 个 值 之 一 。 
口 _QLineEdit，: Normal: 显示 输入 的 字符 (默认 ) 
O QlLineEdit: : Password: 显示 星 号 〈 用 星 号 来 取代 字符 ) 。 
O QlLineEdit: : NoEcho: 什么 也 不 显示 。 
使 用 setEchoMode 来 设置 模式 : 
lineEdit->setEchoMode (QLineEdit: : Password) ; 


Qt 3.2 引 入 了 一 个 增强 特性 inputMask， 它 按 掩 码 规则 来 限制 输入 。 

inputMask 是 一 个 由 字符 组 成 的 字符 串 ， 其 中 每 个 字符 都 对 应 一 个 
接受 某 个 特定 字符 范围 的 规则 。 如 果 你 熟悉 正则 表达 式 ，inputMask 合 
用 的 原理 与 其 基本 相同 。 

inputMask 字 符 有 两 种 类 型 ， 一 类 是 表示 某 个 特定 字符 必须 出 现 ， 
另 一 类 指示 如 果 某 个 字符 出 现 ， 它 需要 受到 规则 的 限制 。 表 17-1 显 示 了 
这 些 字符 的 示例 和 它们 的 含义 。 


表 17-1 
GREN 可 选 字符 
A a ASCII Anz 
N ASCII A 
X Hey 
9 i 


D j nf i~9 


inputMask 古 一 个 由 这 些 字 符 组 合 在 一 起 构成 的 字符 串 ， 有 时 以 分 
写 结束 。 还 有 几 个 具有 特殊 含义 的 字符 ， 如 表 17-2 所 示 。 


表 17-2 


格 接 下 来 的 输入 字符 转换 为 
梅 接 于 来 的 给 入 学 符 转 换 为 小 写 
y | 可 转换 


inputMask 中 的 所 有 其 他 字符 在 QLineEdit 中 都 被 视 为 分 隔 符 。 
表 17-3 显 示 了 一 些 撼 码 示例 和 它们 允许 的 输入 。 
表 17-3 


"ARAARA 9990" $F Athens-2004, 4: fC 'F Sydney-200008 Atlanta-1996 
"AAS a2 i. 允许 March.03-12， 不 允许 May.03.12 或 Seplermher.03.12 


允许 输入 地址， 例如 +: 192.168.0.1 


S 验 QLineEdit 
现在 看 一 下 QLineEdit 的 实际 使 用 情况 。 
(1) 首先 是 头 文件 LineEdit.h: 


include <qmainwindow.h> 
#include <qlineedit.h> 
include <gstring.h> 


class Linefdit : public QMainWindow 
{ 
Q OBJECT 


public: 
LineBdit (QWidget *parent = 0, const char *name = 0); 
QLineEdit *password_entry; 


private slots: 
void Clicked(); 


(2) LineEdit. cpp 是 我 们 很 熟悉 的 类 实现 文件 : 


@include *LineEdit.moc* 
#include <qpushbutton.h> 
@include <qapplication.h> 
include <qlabel.h> 
@include <qlayout.h> 
include <iostream> 


}s 


Linegdit::LineEdit(QWidget *parent, const char *name) : QMainWindow(parent, name) 
{ 

Quidget *widget = new QWidget (this); 

setCentralWidget (widget); 


(3) 用 QGridLayout 排 列 构件 。 指 定 行 数 、 列 数 、 边 距 和 间隔 : 


QGridLayout *grid = new QGridLayout (widget,3,2,10, 10,"grid"); 
QlLineEdit *username_entry = new QLineEdit( widget, *username_entry"); 


password_entry = new QLineEdit( widget, "password entry"); 
password_entry->setEchoMode (QLineEdit: : Password) ; 


grid->addWidget (new QLabel("Username*, widget, "userlabel*), 0, 0, 0); 
grid->addWidget (new QLabel|"Password", widget, “passwordlabel*), 1, 0, 0); 


grid->addWidget (username_entry, 0,1, 0); 
grid->addWidget (password_entry, 1,1, 0); 


QPushButton *button = new QPushButton ("Ok", widget, “button"); 
grid->addwidget (button, 2,1,Q0t::AlignRight); 


resize( 350, 200 ); 


connect (button, SIGNAL(clicked()), this, SLOT(Clicked())); 
} 


| void LineEdit::Clicked(void) 
{ 


std::cout << password_entry->text() << *\n"; 
} 
int main(int argc, char **argv) 
{ 

QApplication app(argc, argv); 

LineEdit ‘window = new LineEdit |); 


app.setMainWidget (window) ; 
window->show() ; 


return app.exec(); 


运行 这 个 程序 ， 你 将 看 到 如 图 17-5 所 示 的 窗口 。 


E erict)@kayak:/nome2/erict|/writing/Beginning Linux Programming 4th Edlc ~ 9 x | 
Ble Edit Yew Terminal Tabs Help 
[ericfj@kayok chopl7 src]$ ./lincedit 
ooh bah 


图 17-5 


实验 解析 

上 述 创建 了 两 个 QLineEdit 构 件 ， 其 中 一 个 通过 设置 它 的 EchoMode 
将 其 变 为 密码 输入 框 ， 当 你 点 击 PushButton 按 钮 时 ， 它 的 内 容 将 被 输 
出 。 注 意 ， 程 序 中 引入 了 一 个 QGridLayout 构 件 ， 当 在 网 格 模式 下 布置 
构件 时 ， 它 非常 有 用 。 当 你 要 把 一 个 构件 添加 到 网 格 中 时 ， 需 要 传递 行 
号 和 列 号 。 左 上 角 的 单元 格 是 起 始 单元 格 ， 它 的 行列 号 分 别 是 0, 0。 


17.4.2 Qt 按 饵 


按钮 构件 是 一 种 随处 可 见 的 构件 ， 不 同 的 工具 包 中 它 的 外 观 、 用 法 
和 API 都 变化 不 大 。Qt 当 然 也 提供 了 标准 的 PushButton、CheckBox 和 
RadioButton 的 变 体 。 

1. QButton: 按钮 基 类 

Qt 中 的 按钮 构件 都 是 派生 自 抽象 类 QButton。 这 个 类 有 查询 和 切换 
按钮 开关 状态 的 方法 ， 还 有 设置 按钮 文本 或 位 图 的 方法 。 

你 永远 不 需要 实例 化 一 个 QButton 构 件 自身 (不 要 混淆 QButton 和 
QPushButton) ， 所 以 这 里 也 不 用 显示 它 的 构造 函数 ， 但 下 面 列 出 了 它 
的 几 个 有 用 的 成 员 函 数 : 


#include <qbutton.h> 


virtual void QButton::setText ( const QString & ) 
virtual void QButton::setPixmap ( const QPixmap & } 


bool QButton::isToggleButton () const 

virtual void QButton::setDown ( bool ) 

bool QButton::isDown () const 

bool QButton::isOn () const 

enum QButton::ToggleState { Off, NoChange, On } 
ToggleState QButton::state () const 


isDown#llisOnek ZCI EH AE FAA. EMI AB TEFEN IZ PB 
返回 TRUE。 

通常 ， 当 某 个 选项 当前 不 可 用 时 ， 你 希望 能 禁用 它 或 让 它 显 示 为 灰 
色 。 你 可 以 通过 调用 QWidget: : setEnable (FALSE) 来 禁用 包括 
QButton 在 内 的 任何 构件 。 

下 面 是 3 个 我 们 感 兴趣 的 QButton 子 类 。 

QPushButton: 一 个 简单 的 按钮 构件 ， 它 在 被 点 击 时 执行 一 些 动 

O QCheckBox: 一 个 可 以 在 开 / 关 (on/off) 状态 之 间 切 换 ， 用 于 

表示 某 一 选项 的 按钮 构件 。 

O QRadioButton: 通常 在 组 中 使 用 的 按钮 构件 ， 一 组 内 同时 只 能 

激活 一 个 按钮 。 

2. QPushButton 

QPushButton 是 一 个 标准 的 通用 按钮 ， 它 包含 如 OK 或 Cancel 这 样 的 
文本 或 一 个 像素 映射 图 标 。 与 所 有 的 QButton 一 样 ， 当 它 被 激活 时 会 发 
出 一 个 dicked 信 号 ， 这 个 信号 通常 会 连接 到 一 个 槽 并 执行 一 些 动 作 。 

你 已 在 前 面 的 例子 中 用 过 QPushButton， 关 于 这 个 最 简单 的 Qt 构件 
还 有 一 件 值得 说 的 事 : 你 可 以 调用 setToggleButton 将 QPushButton 从 一 个 
无 状态 按钮 转变 为 一 个 开关 按钮 〈 即 它 可 以 被 打开 或 关闭 ) 。 请 回忆 上 
一 章 的 内 容 ，GTK+ 用 一 个 单独 的 构件 实现 此 功能 。 

从 完整 性 考虑 ， 这 里 提供 了 它 的 构造 函数 和 几 个 有 用 的 方法 : 


#include <qpushbutton.h> 


QPushButton (Qwidget *parent, const char *name = 0) 
QPushButton (const QString &text, QWidget *parent, const char *name = 0) 
QPushButton (const QIconSet &icon, const QString &text, 

QWidget “parent, const char * name = 0 ) 


void QPushButton::setToggleButton (bool); 


3. QCheckBox 

QCheckBox 是 一 个 有 状态 的 按钮 ， 也 就 是 说 ， 它 可 以 被 打开 或 关 
闭 。 它 的 外 观 取决 于 当前 的 窗口 样式 (Motif、Windows 等 ) ， 但 它 通常 
是 一 个 右边 有 文本 的 打 勾 框 。 

你 还 可 以 将 QCheckBox 设 置 为 第 三 种 状态 〈 即 中 间 状 态 ) DAR 


示 "“ 无 改变 ”。 这 在 极 少数 情况 下 会 用 到 ， 比 如 说 你 无 法 读 取 QCheckBox 
代表 的 选项 的 状态 《〈“ 因 此， 你 目 己 设置 QCheckBox 的 打开 或 关闭 ) ， 但 
是 仍然 想 给 用 户 一 个 机 会 保持 它 状态 的 不 变 。 


#include <qcheckbox.h> 


QCheckBox (QWidget *parent, const char *name = 0 ) 
QCheckBox (const QString &text, QWidget *parent, const char *name = 0 ) 


bool QCheckBox::isChecked () 
void QCheckBox::setTristate ( bool y = TRUE ) 
bool QCheckBox::isTristate () 


4. QRadioButton 

单 选 按钮 是 开关 按钮 ， 它 用 于 在 一 组 选项 中 只 能 选择 一 个 选项 的 情 
况 《 回 想 那 些 老 式 汽车 的 收音 机 ， 每 次 只 有 一 个 电台 按钮 可 以 被 按 
F) 。QRadioButton 本 身 与 QCheckBox 几 乎 没有 什么 区 别 ， 这 是 因为 按 
钮 的 分 组 和 单 选 性 都 是 由 QButtonGroup 类 来 处 理 的 。 它 们 之 间 主 要 的 区 
别 是 ， 单 选 按 钮 的 外 观 是 圆 的 ， 而 不 是 一 个 打 勾 框 。 

QButtonGroup 是 一 个 构件 ， 它 提供 了 一 些 便捷 的 方法 ， 使 得 按钮 组 
的 处 理 更 加 容易 : 


QButtonGroup (QWidget *parent = 0, const char * name = 0 

QButtonGroup (const QString & title, QWidget * parent = 0, const char * name = 0 ) 
int insert (QButton *button, int id = -1) 

void remove (QButton *button) 

int id (QButton *button) const 

int count (}) const 

int selectedId () const 


QBnuttonGroup 的 用 法 非常 简单 ， 如 果 你 使 用 带 title 参 数 的 构造 函 
数 ， 它 甚至 还 提供 了 一 个 可 选 的 包围 按钮 的 框架 。 

你 有 两 种 向 QButtonGroup 添 加 一 个 按钮 的 方法 : 一 种 是 用 insert 方 
法 ， 男 一 种 是 将 QButtonGroup 指 定 为 按钮 的 父 构件 。 你 可 以 在 调用 
insert 时 指定 一 个 id 来 唯一 标识 组 中 的 每 个 按钮 。 这 在 查询 哪个 按钮 被 选 
中 时 特别 有 用 ， 因 为 selectId 返 回 被 选中 按钮 的 id。 

所 有 加 到 组 内 的 QRadioButton 都 自动 具有 了 单 选 性 。 

下 面 是 QRadioButton 的 构造 函数 和 唯一 的 方法 : 


#include <qradiobutton.h> 


QRadioButton (QWidget *parent, const char *name = 0 ) 
QRadioButton (const QString &text, QWidget ‘parent, const char ‘name = 0 ) 


bool QRadioButton::isChecked () 


实 验 QButton 


让 我 们 通过 一 个 Qt 按钮 的 示例 程序 来 应 用 这 些 知识 。 下 面 这 个 程序 
通过 创建 不 同类 型 的 按钮 〈 单 选 按钮 、 检 查 框 和 标准 按钮 ) 来 显示 如 何 
在 应 用 程序 中 使 用 这 些 构件 。 

(1) 输入 Buttons.h: 


#include <qcheckbox.h> 


include <gbutton.h> 


Q OBJECT 


pubiic 
nam 


(2) WE, MAE eR cH AWARS., MAE EXP 
按钮 指针 声明 为 私有 ， 还 有 一 个 辅助 函数 PrintActive 也 是 私有 的 : 
private: 
void PrintActive(QButton *button); 
\CheckBox *checkbox; 
QORadioButton *radiobuttonl, *radiobutton2; 


rivate slots: 
void Clicked(); 


(3) 下 面 是 Buttons.cpp: 


#i 1 
+ pi 上 

i qappli 
$ qiabe 
日 <qia 
#i r 
Buttons: : Buttons (QWidget *parent, const char *name) : QMainWindow(parent, name) 

e iget [t 
wi 
1: x I Layo w è box 
‘`heckButton", widget, “check"); 
vbox->addWidget veckbox) ; 


(4) 你 为 两 个 单 选 按钮 创建 了 一 个 QButtonGroup: 


(5) 接 下 来 是 一 个 输出 给 定 QButton 状 态 的 便捷 方法 : 


实验 解析 

这 个 简单 的 例子 显示 了 如 何 查 询 各 种 类 型 的 Qt 按钮 。 正 如 你 所 看 到 
的 ， 这 些 构件 在 创建 后 大 多 数 情况 下 的 工作 方式 基本 相同 。 例 如 ， 
PrintActive 函 数 显示 了 如 何 获取 一 个 按钮 的 状态 〈 打 开 或 关闭 ) 。 请 注 
意 ， 这 个 函数 可 以 用 于 所 有 维持 状态 的 按钮 类 型 ， 如 检查 框 和 单 选 按 
钮 。 在 大 多 数 情况 下 ， 只 有 创建 这 些 按钮 构件 的 方法 彼此 不 同 。 相 对 而 
言 ， 单 选 按钮 的 创建 过 程 是 最 复杂 的 《因为 一 个 组 中 同时 只 能 有 一 个 按 
钮 处 于 打开 状态 ) ， 它 需要 的 工作 量 最 大 。 对 单 选 按钮 来 说 ， 你 需要 先 
M a 
激活 的 。 


17.4.3 QComboBox 


单 选 按 钮 适用 于 用 户 从 少量 选项 (6 个 或 更 少 ， 中 进行 选择 的 情 
况 。 当 多 于 6 个 选项 时 ， 你 就 很 难 控制 窗口 的 大 小 在 一 个 合理 的 范围 
内 ， 而 且 随 着 选项 数目 的 增多 ， 这 一 状况 会 越 来 越 严 重 。 一 个 完美 的 解 
决 方案 是 使 用 一 个 带 有 下 拉 沈 单 的 输入 框 ， 即 组 合 框 。 当 你 点 击 荣 单 时 
选项 才 会 出 现 ， 选 项 的 数目 只 受到 搜索 选项 列表 方便 程度 的 限制 。 

QComboBox 结 合 了 QLineEdit、QPushButton 和 下 拉 菜 单 的 功能 ， 它 
使 用 户 可 以 从 一 个 无 限 的 选项 中 选择 一 个 选项 。 

QComboBox 可 以 是 读 / 写 或 只 读 的 。 在 读 / 写 模式 下 ， 用 户 可 以 输入 
一 个 替代 选项 ， 而 在 只 读 模 式 下 ， 用 户 只 能 从 下 拉 沫 单 中 进行 选择 。 

在 创建 QComboBox 时 ， 你 可 以 通过 其 构造 函数 的 一 个 布尔 值 参数 
来 指定 它 是 读 / 写 模式 ， 还 是 只 读 模 式 : 

QComboBox *combo = new QComboBox (TRUE, parent, “widgetname”) ; 

传递 TRUE 将 QComboBox 设 置 为 读 / 写 模式 。 其 他 参数 是 常见 的 父 
构件 指针 和 构件 名 。 

与 所 有 Qt 构件 一 样 ，QComboBox 的 使 用 方式 很 灵活 ， 而 且 它 提供 
了 大 量 的 功能 。 你 可 以 单个 添加 选项 ， 也 可 以 一 次 添加 一 组 〈 使 用 
QString 或 传统 的 char* 格 式 ) 。 

你 可 以 调用 insertItem 来 插入 一 个 选项 : 

combo->insertItem(QString("An Item"), 1); 

它 有 一 个 QString 对 象 参数 和 一 个 位 置 索引 参数 。 值 1 设置 该 选项 为 
列表 中 的 第 一 个 选项 。 如 果 你 想 将 它 添加 到 列表 的 末尾 ， 只 需 传 递 一 个 
任意 的 负 整 数 即 可 。 

更 常见 的 情况 是 一 次 添加 多 个 选项 ， 这 时 你 可 以 使 用 QStrList 类 ， 


char” weatner 


如 果 QComboBox 是 读 / 写 模式 ， 那 么 用 户 输入 的 值 将 目 动 加 入 到 选 
项 列表 中 。 这 是 一 个 很 有 用 的 节省 时 间 的 功能 ， 当 用 户 想 不 止 一 次 地 选 
择 同 一 个 输入 值 时 ， 它 可 以 节省 用 户 重 复 输入 的 时 间 。 

InsertionPolicy 控 制 新 输入 的 值 在 选项 列表 的 何 处 插入 。 你 可 以 选择 
的 选项 见 表 17-4。 


表 17-4 


在 让 ete ee 
rim TEPOHRZEMARRBAMM 
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你 可 以 调用 eee 设置 QComboBox 的 插入 策略 : 
combo->setInsertionPolicy (QComboBox: :AtTop) ; 
下 面 看 一 下 QComboBox 的 构造 函数 和 部 分 方法 


#include <qcombobox.h> 
QComboBox (QWidget “parent = 0, const char *name = 0) 


QComboBox (bool readwrite, QWidget *parent = 0, const char *name = 0) 


int count () 

void insertStringList (const QStringList slist, int index = <1) 

void insertStrList (const QStrList glist, int index = <1) 

void insertStrList (const QStrList *list, int index = -1) 

void insertStrList (const char **strings, int numStrings = -1, int index = -1) 
void insertItem (const QString &t, int index = -1) 

void removeItem (int index) 


virtual void setCurrentItem (int index) 
QString currentText () 


virtual void gchar: {const QString &) 
ania eatPAitahia fthaatt 


count Pk] 数 返 回 多 | 表 中 选项 用 的 数目 。QStringList 和 QStrList 是 你 可 以 
用 来 增加 选项 的 Qt 字符 串 集 合 类 。 你 可 以 调用 removeItem 来 删除 选项 ， 
调用 currentText 和 setCurrentText 来 获取 和 设置 当前 选项 ， 调 用 setEditable 
来 切换 可 编辑 状态 。 
每 当 一 个 新 选项 被 选中 时 ，QComboBox 就 发 出 textChanged 
(QString&) 信号 ， 并 以 新 选中 的 选项 做 为 其 参数 。 


S 验 QComboBox 

在 本 例 中 ， 你 将 尝试 使 用 QComboBox， 并 看 到 带 参 数 的 信号 和 槽 
是 如 何 工 作 的。 你 将 创建 一 个 继承 自 QMainWindow 的 ComboBox 类 。 它 
有 两 个 QComboBox， 一 个 是 读 / 写 模式 ， 一 个 是 只 读 模 式 ， 你 将 连接 
textChanged 信 号 ， 以 获取 每 次 选中 的 值 。 

(1) 输入 下 列 代 码 ， 并 将 它 命名 为 ComboBox.h: 


finclude <qmainwindow.h> 
#include <qcombobox.h> 


class ComboBox : public QMainWindow 
{ 
Q_ OBJECT 


public: 
ComboBox (QWidget *parent = 0, const char *name = 0); 


private slots: 
void Changed(const QString& s); 


(2) 界面 由 两 个 QComboBox 构 件 组 成 ， 一 个 可 编辑 ， 另 一 个 是 只 
读 模 式 。 你 在 两 个 构件 中 放置 相同 的 选项 列表 : 


#include *ComboBox.moc* 


#include <glayout.h> 
#include <iostream> 


ComboBox: :ComboBox(QWidget *parent, const char *name) : QMainWindow(parent, nane) 
{ 
QWidget *widget = new QWidget (this); 


setCentralWidget {widget}; 
QVBoxLayout *vbox = new QOVBoxLayout (widget, 5, 10, *vbox"); 


QComboBox *editablecombo = new QComboBox(TRUE, widget, *editable"}; 
vbox->addWidget (editablecombo} ; 

QComboBox *readonlycombo = new QComboBox(FALSE, widget, "“readonly"); 
vbox->addWidget (readonlycombo} ; 


static const char* items[] = ({ "Macbeth", “Twelfth Night", "Othello", 0 }; 
editablecombo->insertStrList (items); 
readonlycombo->insertStrList (items); 


connect (editablecombo, SIGNAL(textChangedi(const QStringé)), 
this, SLOT(Changedi(const QString&))); 
resize( 350, 200 ); 


) 


(3) 下 面 是 槽 函数 。 注 意 由 信号 传递 的 QString 参 数 ; 
void ComboBox: ;Changed(const QString& s) 
std::cout << s << *\n"; 


) 


int main(int argc, char **argv) 

{ 
QApplication app(argc, argv); 
ComboBox *window = new ComboBox ({) ; 


app. setMainWidget (window) ; 
window->show();: 


return app.exec(); 


在 图 17-6 中 ， 你 可 以 看 到 ， 可 编辑 的 QComboBox 里 新 选中 的 选项 输 
出 在 命令 行 上 。 


@ ericfj@kayak:/nomezjericfi/writing/Beginning Linux Programming 4th Ed/c ~ n` x 
He Edit View Jerminal Tabs Help 


[cricfj@kayak chapl? src]$ ./combobox 
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图 17-6 


实验 解析 

创建 组 合 框 构件 的 过 程 与 创建 任何 其 他 构件 的 过 程 非 常 相似 。 它 主 
要 增加 了 一 个 对 insertStrList 函 数 的 调用 来 存储 组 合 框 的 选项 列表 。 

和 其 他 包含 文本 的 构件 一 样 ， 你 可 以 设置 一 个 函数 ， 每 当 组 合 框 中 
的 值 (或 更 通用 的 说 法 : 文本 ) 被 改变 时 ， 该 函数 就 会 被 调用 。 


17.4.4 QListView 


Qt 中 的 列表 和 树 由 QListView 构 件 提 供 。QListView 既 可 以 显示 平面 
列表 ， 也 可 以 显示 被 分 为 行 和 列 的 层次 化 数据 。 它 非常 适合 于 显示 如 日 
录 结 构 这 样 的 数据 ， 因 为 子 元 素 可 以 通过 点 击 加 减 (+/-) 框 被 展开 和 收 
起 ， 就 像 一 个 文件 查看 器 一 样 。 

与 GTK+ 的 ListView 构 件 不 同 ，QListView 同 时 处 理 数 据 和 视图 ， 虽 
然 它 没 有 提供 很 好 的 灵活 性 ， 但 却 提供 了 很 好 的 易 用 性 。 

在 使 用 QListView 时 ， 你 可 以 选择 行 或 单独 的 单元 ， 然 后 剪 切 和 粘 
贴 数据 、 按 列 排序 ， 而 且 你 可 以 在 单元 里 放置 QCheckBox 构 件 。 
QListView 内 建 了 很 多 功能 ， 程 序 员 只 需 添加 数据 和 建立 一 些 格式 规 
jl 


“你 按 通常 的 广 式 创建 QListView， 指 定 父 构件 和 构件 名 : 


istView *view = new QLis ew(parent, “name” 


cs 使用 adaCoiummnz 法 设置 标题 : 


view->addColumn ("Left / Fixed width 
>addColumn ("Right Sep mg aut 5 


“A 5 按 像素 设置 如 果 省 咯 此 参数 ， 那么 默认 它 为 该 列 中 最 宽 的 元 
系 的 宽度 。 当 列 中 元 素 增 加 或 减少 时 ， 列 会 上 自动 调整 其 宽度 。 

数据 通过 QListViewItem 对 象 添加 到 QListView， 它 代表 了 一 行 数 
据 。 你 所 要 做 的 就 是 把 QListView 和 行 元 素 传 递 给 QListViewItem 的 构造 
E S 

第 一 个 参数 要 TE ERONEN (本 例 即 是 如 此 ) ， 要 么 是 另 一 
个 QListViewItem。 如 果 你 传递 了 一 个 QListViewItem， 这 一 行 会 变 成 该 
ewin i 树 形 结构 就 是 通过 传递 一 个 QListView 作 为 顶 
层 节 点 ， 后 续 传 递 的 QListViewItem 作 为 子 节点 而 形成 的 。 

其 余 参 数 是 每 列 的 数据 ， 如 果 没 有 设置 就 默认 为 NULL 。 

这 样 ， 添 加 一 个 子 节 点 只 需要 传递 一 个 顶层 指针 。 如 果 不 想 在 将 来 
to i ， 你 束 不 需要 保存 返回 的 指 
如 果 看 一 A 你 会 看 到 用 is 遍历 树 的 各 种 方法 
《如 果 你 想 要 修改 特定 行 的 话 ) : 


#include <qlistview.h> 


virtual void insertItem ( QListViewItem * newChild ) 
virtual void setText ( int column, const QString & text ) 


virtual QString text ( int column ) const 
QListViewItem *firstChild () const 
QListViewltem *nextSibling () const 
QListViewItem *parent () const 
QListViewItem *itemAbove () 
QListViewItem *itemBelow () 


你 可 以 通过 在 QListView 自 身上 调用 firstChild 来 获取 树 中 的 第 一 
行 。 然 后 ， 通 过 反复 调用 firstChild 和 nextSibling 来 返回 这 个 树 的 一 部 分 
REM 

下 面 这 段 代 码 输 出 所 有 顶层 节点 的 第 一 列 : 


QListViewItem *child = view->firstChild(); 


你 可 以 在 Qt API 文 档 中 找到 关于 QListView、QListViewItem 和 
QCheckListView 的 所 有 细节 。 


S 验 QListView 

在 这 个 实验 中 ， 运 用 你 所 学 的 知识 ， 编 写 一 个 短小 的 QListView 构 
件 示例 程序 。 

为 简洁 起 见 ， 让 我 们 跳 过 头 文件 ， 直 接 看 类 的 实现 文件 
List View.cpp: 


tinclude "ListView. moc" 


ListView: :ListView(QWidget *parent, const char *name) ; QMainWindow(parent, name) 


人 


listview = new QListView(this, "listviewl"); 


listview-raddColum ("Artist"); 
listview->addColumn ("Title"); 
listview->addColum ("Catalogue"); 


listview->setRootIsDecorated (TRUE) ; 


QListViewltem *toplevel = new QListViewZtem(listview, "Avril Lavigne", 
"Let Go", "AVCDOL"); 


new QListViewltem(toplevel, "Complicated"); 
new QListViewltem(toplevel, 'Sk8er Boi"); 


setCentralividget (listview) ; 


int main(int argc, char **argv) 

( 
QApplication app (argc, argv) ; 
ListView *window = new ListView(); 


app. setMainiidget (window) ; 
window->show() ; 


return app.exec|); 


实验 解析 
QListView 构 件 看 上 去 很 复杂 ， 因 为 它 同时 扮演 了 项 目 列 表 和 项 目 
树 的 角色 。 你 的 代码 需要 为 列表 中 的 每 个 元 素 创建 一 个 QListViewlItem 
实例 。 每 个 QListViewItem 实 例 都 有 一 个 父 节 点 。 使 用 构件 本 身 作为 其 
父 节 点 的 是 顶层 节点 ， 使 用 男 一 个 QListViewItem 作 为 其 父 节 点 的 是 子 
节点 。 这 个 例子 显示 了 一 个 只 有 一 层 深度 的 ”QListViewItem 实 例 ， 但 你 
实际 上 可 以 创建 更 深 的 节点 树 。 

编译 并 运行 这 个 ListView 例 子 ， 你 将 看 到 如 图 17-7 所 示 的 QListView 
构件 。 

注意 : 子 行 是 如 何 相 对 于 父 行 缩 进 的 。 加 / 减 框 表明 那里 有 隐藏 或 
可 折 闭 的 行 ， 它 们 在 默认 情况 下 不 展现 出 来 。 你 是 通过 setRootIs- 
Decorated 来 设置 它们 的 。 


} 


ct listview 
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17.5 对话 框 


到 现在 为 止 ， 你 都 是 通过 继承 QMainWindow 来 创建 界面 。 对 应 用 
程序 中 的 主 窗口 来 说 ， 使 用 QMainWindow 是 合适 的 ， 但 对 于 生命 期 比 
较 短 的 对 话 框 来 说 ， 你 应 该 使 用 QDialog 构 件 。 

当 你 想 让 用 户 为 某 一 特定 任务 输入 特定 的 信息 时 ， 或 者 你 想 回 用户 
显示 一 些 信息 (如 一 条 警告 或 错误 信息 ) 时 ， 对 话 框 是 很 有 用 的 。 通过 
继承 QDialog 来 完成 这 些 任 务 是 一 个 好 方法 ， 因 为 你 可 以 获取 到 一 些 便 
捷 的 方法 来 运行 对 话 框 ， 使 用 专门 设计 的 信号 和 模 来 处 理 用 户 啊 应 。 

除了 通常 的 模式 对 话 框 和 非 模 式 对 话 框 以 外 ，Qt 还 提供 了 一 种 半 模 
式 对 话 框 。 下 面 我 们 来 回顾 一 下 模式 对 话 框 和 非 模 式 对 话 框 的 区 别 ， 同 
时 也 看 看 何 为 半 模 式 对 话 框 。 

O 模式 对 话 框 : 阻止 所 有 其 他 窗口 的 输入 ， 以 强制 用 户 啊 应 当前 

ae 它 用 于 从 用 户 那里 获取 即时 的 啊 应 和 显示 严重 的 错误 信 


a 非 模式 对 话 框 ; 非 阻塞 窗口 ， 与 应 用 程序 中 的 其 他 窗口 一 起 正 
党 操作。 它 用 于 搜索 或 输入 窗口 ， 你 可 以 在 它 和 主 窗 口 之 间 复 制 、 
粘贴 数据 。 
口 “ 半 模式 对 话 框 : 一 个 没有 自己 的 事件 循环 的 模式 对 话 框 。 这 样 
可 以 将 控制 权 返 回 到 应 用 程序 ， 但 仍 阻塞 对 话 框 以 外 的 所 有 窗口 输 
。 它 只 在 极 少数 情况 下 有 用 ， 比 如 当 你 有 一 个 进度 条 表示 某 个 耗 
时 的 关键 操作 的 进度 时 ， 你 可 能 想 要 给 用 户 一 个 取消 的 机 会 。 因 为 
半 模 式 对 话 框 没有 自己 的 事件 循环 ， 所 以 你 必须 定期 调用 
QApplication: : processEvents 来 更 新 对 话 框 。 


17.5.1 QDialog 


QDialog 是 Qt 中 的 对 话 框 基 类 ， 它 提供 了 exec 和 show 方 法 来 处 理 模 
e 集成 了 QLayout， 并 有 几 个 用 于 啊 应 按钮 按 下 的 信 
号 和 

你 通常 将 为 对 话 框 创建 一 个 继承 自 QDialog 的 类 ， 同 其 中 增加 构件 
来 创建 对 话 框 界面 : 


与 QMainWindow 不 同 ， 你 可 以 直接 将 QLayout 对 象 的 parent 参 数 设 
-o 而 无 需 创建 一 个 无 用 的 QWidget， 并 将 它 作 为 QLayout 
IEE o 


注意 ， 这 个 例子 省 略 了 用 于 创建 ok_pushbutton 和 
cancel_pushbutton 构 件 的 代码 。 


QDialog 有 两 个 槽 : 〈accept 和 reject) ， 它 们 用 于 表明 对 话 框 的 结 
果 。 这 个 结果 由 exec 方 法 返回 。 通 常情 况 下 ， 你 将 OK 和 Cancel 按 钮 的 信 
号 连接 到 槽 ， 就 像 在 上 面 的 MyDialog 类 中 所 做 的 那样 。 

1. 模式 对 话 框 

要 将 对 话 框 作为 模式 对 话 框 ， 你 需要 调用 exec。 该 函数 弹出 对 话 
框 ， 并 根据 被 激活 的 槽 返回 QDialog: : Accepted 或 QDialog: : 
Rejected: 


lis, “mydialog 


/ User clicked ‘Ok’ 


注意 ， 在 调用 exec 时 ， 其 他 所 有 处 理 都 被 阻塞 ， 所 以 当 程 序 中 有 对 
时 间 要 求 比较 高 的 代码 时 ， 使 用 非 模式 或 半 模 式 对 话 框 更 加 合适 一 些 。 

2. 非 模 式 对 话 框 

非 模式 对 话 框 与 普通 主 窗口 没有 多 大 区 别 ， 主 要 的 不 同 是 非 模式 对 
话 框 将 它们 上 自己 定位 在 其 父 窗口 之 上 ， 与 父 窗口 共享 任务 栏 ， 并 在 
accept 或 reject 醒 被 调用 时 自动 隐藏 o 

要 显示 一 个 非 模 式 对 话 框 ， 与 显示 QMainWindow 的 方式 相同 ， 调 
用 show 方 法 即 可 


MyDialog *dialog = new 


. 
. 
Murr 


show EAI RUSE ANT ANE, BB ar RNR E ARE Ah BRIA. Jy T bE FEA 
T _ Ey eR ASP ERA 


QWidger *r 


与 模式 对 话 框 一 样 ， 当 一 个 按钮 被 按 下 时 ， 对 话 框 将 自动 隐藏 。 

3. 半 模 式 对 话 框 

要 创建 半 模 式 对 话 框 ， 你 必须 在 QDialog 的 构造 函数 中 设置 模式 标 
志 ， 并 使 用 show 方 法 : 

QDialog (QWidget *parent=0, const char *name=0, bool 
modal=FALSE, WFlags f=0) 

对 于 合式 对 话 框 ， 你 没有 将 modal 设 置 为 TRUE 的 原因 是 : 调用 exec 
将 强制 对 话 框 变 为 模式 对 话 框 ， 而 不 管 这 个 标志 是 什么 。 

i eu 


MyS¥ 


一 旦 定义 好 一 个 对 话 框 ， 你 就 可 以 调用 show 函 数 ， 然 后 继续 运行 程 
Fe, Fe sik, 调 : Bite eatin 新 对 话 框 : 


= My 
IOWI J; 


在 继续 处 理 之 前 ， 要 保证 对 话 框 未 被 取消 。 注 意 ，wasCancelled 并 
不 是 QDialog 的 一 部 分 ， 你 必须 自己 提供 它 。 

Qt 还 提供 了 现成 的 QDialog 子 类 ， 它 们 专用 于 特定 的 任务 ， 如 文件 
i 文本 输入 、 进 度 条 和 消 恩 框 等 。 使 用 这 些 构 件 可 以 省 去 你 许多 麻 
从。 


17.5.2 QMessageBox 


QMessageBox 是 一 个 模式 对 话 框 ， 它 用 于 显示 一 段 简 单 的 消息 ， 并 
伴 有 图 标 和 按钮 。 图 标的 样式 取决 于 消 明 的 严重 程度 ， 它 可 以 是 常规 信 
恩 、 警 告 或 其 他 的 关键 信息 。 

下 面 是 QMessageBox 类 用 于 创建 和 显示 这 3 类 信息 的 静态 方法 : 


#include <qmessagebox.h> 


int information (QWidget *parent, const QString &caption, const QString text, 
int button0, int buttonl=0, int button2=0) 


int warning (QWidget *parent, const QString &caption, const QString text, 
int button0, int buttonl, int button2«0) 
int critical (QWidget *parent, const QString &caption, const QString &text, 


int button0, int buttonl, int button2=0) 


QMessageBox 预 先 提 供 了 一 系列 的 按钮 ， 它 们 与 上 述 静 态 方法 的 返 
回 值 相 对 应 : 


O0 QMessageBox: : Ok; 

口 “QMessageBox: : Cancel; 

O QMessageBox: : Yes; 

O QMessageBox: : No; 

O QMessageBox: : Abort; 

O QMessageBox: : Retry; 

O QMessageBox: : Ignore. 

QMessageBoxit 一 个 典型 使 用 方法 如 下 所 示 : 
QMessageBox: :Yes | DR 
QMessageBox: :No | QMessageBox: :Escape)} ; 


你 将 按钮 代码 与 Default 和 Escape 做 或 | > 运算 ， 是 为 了 设置 键盘 
上 的 Enter 键 和 Esc 键 被 按 下 时 的 默认 动作 。 最 终 的 对 话 框 如 图 17-8 所 
TR 


Engine Room Query 


iD) Do you wish to engage the HyperDrive? 


图 17-8 


17.5.3 QInputDialog 


QInputDialog 用 于 输入 单 值 数据 ， 它 可 以 是 文本 、 一 个 下 拉 列 表 中 
的 选项 、 一 个 整数 或 一 个 浮 点 数 。QInputDialog 类 有 与 QMessageBox 类 


似 的 静态 方法 ， 不 过 更 复杂 一 


参数 都 有 默认 值 。 


#include <qinputdialog.h> 


扩 ， 因 为 它们 有 许多 参数 ， 但 好 在 大 多 数 


QString getText (const QString &caption, const QString &label, 


QLineEdit::EchoMode mode=QLineEdit: :Normal, 
const QString &text=QString::null, bool * ok = 0, 
QWidget * parent = 0, const char * name = 0) 


QString getItem (const QString &caption, const QString é&label, 
const QStringList &list, int current#0, bool editable#TRUE, 
bool * ok=0, QWidget *parent = 0, const char *name«0) 


int getInteger (const QString «caption, const QString label, int num=0, 
int from = -2147483647, int to = 2147483647, int step = 1, 
bool * ok = 0, QWidget * parent = 0, const char * name = 0) 


double getDouble (const QString «caption, const QString label, double num = 0, 
double from = -2147483647, double to = 2147483647, 
int decimals = 1, bool * ok = 0, QWidget * parent = 0, 


const char * name = 0 ) 


如 条 要 输入 一 行文 本 ， 你 可 以 这 样 编写 代码 : 


bool result; 


QString text = QInputDialog::getText("Question*, “What is your Quest?:" 
QLineEdit::Normal, 
QString: :null, Gresult, this, “input” 


if (result) { 
doSomething (text) ; 

} else { 

// user pressed cancel 

} 


QinputDialog 由 一 个 QLineEdit 构 件 和 OK、Cancel 按 钮 组 成 ， 见 图 


17-9. 


Question 
What is your Quest?: 
to find the grail. 


图 17-9 


HHQInputDialog: :getText 创 建 的 对 话 框 使 用 了 一 个 QLineEdit 构 件 。 
你 传递 给 getText 函 数 的 编辑 模式 参数 用 于 控制 如 何 将 文本 回 显 给 用 户 ， 
这 与 QLineEdit 构 件 中 同一 模式 的 作用 完全 相同 。 你 还 可 以 设置 默认 的 
文本 或 像 上 面 那 样 将 它 设 置 为 空 。 每 个 QInputDialog 都 有 OK 和 Cancel 按 
钮 ， 它 传递 一 个 布尔 值 指针 给 该 方法 以 表明 哪个 按钮 被 按 下 。 如 果 用 户 
按 下 OK 按钮 ， 那 么 result 将 为 TRUE。 

getItem 通 过 QComboBox 回 用 户 提 供 一 个 选项 列表 : 


options << "London" << “New York” << "Paris"; 
QString city = QInputDialog: :getitem(*Holiday”, 


ul 


生成 的 对 话 框 见 图 17-10。 
Holiday 


Please select a destination: 


paris] v | 
| oK | | Cancel | 


图 17-10 


getInteger 和 getDouble 的 工作 方式 都 类 似 ， 我 们 在 这 里 就 不 展开 讲 
re: 


YT aes 


17.5.4 make {ij {/,makefile 5: Sei 


Fay FE AD KDE MIQUE A eed Se, ALA is makefile x 
件 变 得 非常 复杂 ， 它 需要 使 用 moc， 并 且 到 处 都 要 用 到 库 。 幸 运 的 是 ， 


Qt 目 带 了 一 个 被 称 为 gmake 的 工具 ， 它 可 以 帮助 你 创建 makefile 文 件 。 


如 果 以 前 使 用 过 Qt， 你 可 能 会 对 工具 tmake 比 较 熟悉 ， 它 是 较 
早 版 本 的 Qt 目 带 的 一 个 早期 的 、 类 似 qmake 的 工具 现在 已 不 
FA) 。 


qmake 以 .pro 文 件 作 为 输入 。 这 个 文件 包含 了 编译 所 需 的 最 基本 信 
上 ， 如 源 文件 、 头 文件 、 目 标 二 进 制 文 件 和 KDE/Qt 库 的 位 置 。 
一 个 典型 的 KDE.pro 文 件 如 下 所 示 : 


你 指定 了 目标 二 进 制 文件 、 临 时 的 moc 和 目标 目录 、KDE 库 路 径 、 
要 编译 的 源 文件 和 头 文件 。 注 意 ，KDE 头 文件 和 库 文 件 的 目录 取决 于 你 
所 使 用 的 Linux 发 行 版 。SUSE 用 户 要 把 INCLUDEPATH 设 置 为 
/opt/kde3/include，QMAKE_LIBDIR_X11 设 置 为 /opt/kde3/lib。 

$ qmake file.pro -o Makefile 

接 下 来 ， 你 就 可 以 像 通常 一 样 运行 nake， 就 这 么 简单 。 对 于 任何 复 
杂 程 度 的 KDE/Qt 程 序 来 说 ， 你 都 应 该 使 用 dmake 来 简化 编译 过 程 。 


17.6 KDEM 32440 TA 


为 了 展示 KDE 构 件 的 强大 功能 ， 我 们 把 沫 单 和 工具 栏 留 到 最 后 来 
讲 ， 因 为 它们 非常 好 地 说 明了 ， 相 比 使 用 Qt 或 其 他 图 形 用 户 界面 工具 
包 ， T e E E 
iis EGUI h, 菜单 项 和 工具 栏 项 是 不 同 的 元 素 ， 它 们 各 有 各 的 
le PARTIE EAT BENT AFF ER AE HC, Bil MAAR AE 
Ty 


Tl. 

KDE 程 序 员 提 出 了 一 个 更 好 的 解决 方案 。 与 使 用 分 开 解决 的 方法 不 
同 ，KDE 定 义 了 一 个 KAction 构 件 来 代表 应 用 程序 可 以 执行 的 动作 。 这 
个 动作 可 以 是 打开 新 文档 、 保 存 文件 或 显示 帮助 窗口 等 。 

创建 KAction 时 ， 辣 它 传递 一 个 文本 、 快 捷 键 、 图 标 和 槽 (KAction 
被 激活 时 调用 ) : 


,然后 ， KAction 可 以 在 不 加 任何 其 他 描述 的 情况 下 插入 到 沫 单 和 工 


ew See Steet menu}; 


这 样 你 就 创建 了 一 个 New 荣 单 和 工具 栏 项 . 在 它 被 点 击 时 ， 将 调用 
newFile. 

如 果 你 想 禁 用 KAction， 比 如 说 你 不 想 让 用 户 创建 新 文件 ， 只 需 下 
面 一 行 代码 : 
Dew LL ee Chistes eran 7 


XM EKDE AA CAEP AA, MARAA. FMA T 
KAction 的 构造 “i eki 函数 : 


#include <kde/kaction.h> 


KAction st aces rin ng &text, const KShortcut acing const QObject *receiver, 
onst char *slot, QObject *par mst char ‘name = 0) 


KDE 提 供 了 标准 的 mene 象 ， 这 确保 了 文本 、 图 标 和 快捷 键 在 
所 有 KDE 应 用 程序 中 都 是 一 样 的 : 


#include <kde/kaction.h> 


KAction * openNew (const QObject ‘recvr, const char ‘slot, 
KActionCollection* parent, 
const char *name = 0 ) 

KAction * save ... 

KAction * saveAs ... 

KAction * revert ... 

KAction * close ... 

KAction * print .. 

etc. 


每 个 标准 动作 都 使 用 相同 的 参数 WS ECU ALA PK AL, — 
KActionCollection 对 象 科 KAction 名 字 。KActionCollection 对 象 管理 窗口 
中 的 KAction， 你 可 以 通过 调用 KMainWindow 的 action-Collection 方 法 来 


得 到 当前 对 象 : 


X 验 一 个 禹 有 菜单 和 工具 栏 的 KDE 应 用 程序 
你 将 在 下 面 这 个 例子 中 尝试 在 KDE 应 用 程序 中 使 用 KAction。 
(1) 首先 ， 从 头 文件 KDEMenu.h 开 始 。KDEMenu 是 
KMainWindow 的 子 类 ，KMainWindow 本 身 义 是 QMainWindow 的 子 类 。 
KMainWindow 在 KDE 中 处 理会 话 管理 ， 它 集成 了 工具 栏 和 状态 栏 。 


(2) 在 KDEMenu.cpp 中 ， 第 一 行 的 #include 语 句 用 于 包括 你 将 使 用 
的 构件 声明 : 


ude 


(3) 在 构造 函数 中 ， 你 创建 了 3 个 KAction 构 件 。new_file 以 手工 定 
义 的 方式 创建 ，quit_action 和 help_action 使 用 标准 的 KAction 定 义 : 


Kaction *help_action = xStdAction::aboutApp(this, SLOT(aboutay 


(4) BE PASSA, HECA BIKA pplication AEF: 


(5) 现在 ， 在 菜单 和 工具 栏 中 插入 动作 ， 并 在 new_file 和 
quit_action 之 间 插 入 一 个 分 隔 线 : 


quit_action p 


(6) Bae EN: aboutApp 创 建 一 个 KAbout 对 话 框 来 显示 
程序 相关 信息 。 注 意 ，dnuit 槽 是 作为 KApplication 的 一 部 分 来 定义 的 : 


(7) 接 下 来 ， 你 需要 为 qmake 创 建 一 个 menu.pro 文 件 : 


BJECT 
ICL t ade/) 
MAK ce DED 
MAKE. Sl ji =l 
URC KDE 
{EADER KDEMenu.t 
8) 运 ake | 然后 编 详 和 
qmake menu.p: © Makefil 
ke 
. /kdemenu 
RP J3 
实验 解析 


虽然 这 个 例子 看 上 去 比 其 他 例子 要 长 ， 但 其 创建 菜单 栏 和 菜单 的 代 
人 码 还 是 相对 比较 简洁 的 。KAction 构 件 的 好 处 是 : 你 可 以 在 多 个 地 方 使 
QUE TAH RIESE AE EASE ALP, HEAR TEI PIA AT 

现 。 

编译 KDE 应 用 程序 所 需 的 工作 量 比 编译 其 他 大 多 数 程序 都 要 多 ， 至 
少 乍 一 看 是 这 样 。 但 事实 上 ，menu.pro 文 件 和 qmake 命 令 已 隐藏 了 大 量 
的 设置 ， 否 则 你 必须 在 makefile 文 件 中 手工 进行 这 些 设置 。 

图 17-11 和 图 17-12 显 示 了 窗口 中 菜单 和 工具 栏 按 钮 的 外 观 。 


x — ae es Pr 
tile Heip 


| 


图 17-11 


‘Eile Help 


{0} Quit ctri+Q 


17-12 


至 此 ， 我 们 已 经 学 习 完了 Qt 和 KDE， 并 且 介绍 了 GUI 应 用 程序 的 基 
本 元 素 ， 包 括 窗口 、 布 局 、 按 钮 、 对 话 框 和 菜单 。 但 还 有 许多 Qt 和 KDE 
构件 未 介绍 ， 如 QColorDialog (MERRIE) 、KHTML (Web 浏 
览 器 构件 ) 等 ， 它 们 在 Trolltech 和 KDE 的 网 站 上 都 有 详细 的 文档 介绍 。 


17.7 “使 用 KDE/Qt 编 号 CD 数据 库 应 用 程 
a 

让 我 们 再 次 把 注意 力 集 中 到 CD 应 用 程序 上 来 ， 现 在 你 可 以 
用 KDE/Qt 的 强大 功能 来 实现 它 了 。 你 将 使 用 和 第 16 章 一 样 的 窗口 布 
局 ， 并 实现 类 似 的 功能 。 

先 回忆 一 下 你 想 让 CD 数据 库 应 用 程序 实现 的 功能 : 

O 通过 GUI 界 面 登 录 数 据 库 ; 

Oo 搜索 CD; 

O 显示 CD 和 曲目 信息 ; 

口 ” 问 数 据 库 中 添加 CD; 

Oo 显示 一 个 “关于 ”(About) 窗口 。 


17.7.1 主 窗 口 


Pa 它 包 含 搜索 输入 构件 和 搜索 结 
果 列 表 。 

(1) 先 输入 MainWindow.h 的 代码 〈 或 从 本 书 的 网 站 上 下 载 它 ) o 
因为 窗口 包含 一 个 用 于 搜索 CD 的 QLineEdit 构 件 和 一 个 用 于 显示 搜索 结 
果 的 QListView 构 件 ， 所 以 你 需要 包含 qlistview.h 和 qlineedit.h 头 文件 : 


(2) MainWindow.cpp 是 这 个 程序 中 最 复杂 的 部 分 。 在 构造 函数 
中 ， 你 创建 主 窗口 界面 并 将 必需 的 信号 连接 到 槽 。 与 以 往 一 样 ， 从 
#include 语 句 开 始 : 


(3) 现在 用 KAction 构 件 创建 沫 单 和 工具 栏 项 : 


(4) 为 了 寻求 变化 ， 你 用 QBox 布 局 构件 来 取代 通常 的 QLayout 


(5) 接 下 来 是 QListView 构 件 ， 它 占据 了 窗口 的 大 部 分 区 域 。 然 
后 ， 你 将 必需 的 信号 连接 到 doSearch 槽 ， 来 执行 CD 数据 库 查 询 。 你 添加 
一 条 空 信息 让 KMainWindow 的 状态 栏 可 见 : 


(6) doSearch 模 是 应 用 程序 中 最 重要 的 部 分 。 它 读 取 搜索 字符 
串 ， 提 取 所 有 匹配 的 CD 和 它们 的 曲目 。 其 逻辑 和 第 16 章 中 
GNOME/GTK+ 的 doSearch 完 全 相同 。 


(7) 提取 匹配 CD 的 标识 Gd) ， 更 新 状态 栏 以 显示 搜索 结果 : 


(8) 对 每 个 d， 取 得 CD 信息 ， 择 入 到 QListView 中 ， 并 获取 这 个 
CD 的 所 有 曲目 : 


(9) 当 addcd_action 羔 单项 或 工具 栏 按钮 被 激活 时 ，AddCd 槽 将 被 


k) 
调用 : 
void MainWindow: :AddCd() 


AddCdDialog *dialog = new AddCdDialog(this); 
Gialog->show({) ; 


其 运行 结果 见 图 17-13。 
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tile Help 


加 


Search Text: Pink 


| litle Artist Catalogue 

= Dark Side ofthe Moon Fink Floyd D00002404P 
| =- lWish You were Here Pink Floyd 8000024045 
| “Track 1. Shine on you crazy diamond 
| 


Track 2. Welcome to the machine 

Track 3. Have a cigar 

Track 4 Wish you were here 

Track 5. Shine on you crazy diamond pt 2 


Displaying 2 result(s) for search string ' Pink * 


图 17-13 


17.7.2 — AddCdDialog 


要 问 数 据 库 中 添加 CD， 你 需要 编写 一 个 对 话 框 ， 对 话 框 中 有 一 些 
需要 输入 的 字段 。 

(1) 输入 以 下 代码 ， 将 它 命名 为 AddCdDialog.h。 注 意 : 
AddCdDialog 继 承 自 KDialogBase (一 个 KDE 对 话 框 构件 )。 


#include <kde/kdialogbase.h> 
#include <glineedit.h> 


class AdGCdDialog : public KDialogBase 
Q_ OBJECT 


public: 
AddCdDialog (QWidget “parent) ; 


private: 


QLineEdit *artist_entry, *title_entry, *catalogue_entry; 


(2) 接 下 来 是 AddCdDialog.cpp， 它 在 okClicked 槽 中 调用 了 
MySQL 接 口 代码 的 add_cd: 


include “AdéCdDialog.h* 
include ‘app_mysq!l .h* 


finclude <qlayout.h> 
#include <qlabel.h> 


AddCdDialog: :AddCdDialog( QWidget *parent) 
: KDialogBase{ parent, “AddCD", false, “Add CD"， 
KDialogBase: :Ok|KDialogBase::Cancel, KDialogBase::Ok, true } 


Widget *widger = new QWidget (this); 
setMainWidget (widget) ; 


QGridLayout *grid = new QGridLayout (widget,3,2,10, 5,"grid*): 


gric->addwidget (new QLabel(*Artist*, widget, “artistlabel"), 0, 0, 0); 
grid->addwidget (new QLabel(*Title*, widget, “titlelabel"), 1, 0, 0); 
grid->adéwWidget (new QLabel(*Catalogue*, widget, “cataloguelabel*}, 2, 0, 0); 


artist_entry « new QlineEdit( widget, *artist_entry”); 
title_entry = new QLineEdit! widget, ‘title_entry*); 
catalogue_entry = new QLineEdic( widget, “catalogue_entry"); 


grid->addwidget (artist_entry, 0,1, 0); 
grid-saddWidget (title_entry, 1,1, 0); 
grid->addwidget (catalogue_entry, 2,1, 0); 


connect (this, SIGNAL(okClicked(}), this, SLOT(okClicked(})); 


void AddCdDialog: :okClicked{) 
{ 

char artist [200); 

char titie[200]; 

char catalogue[200]; 

int cd id = 0; 


strcpy (artist, artist_entry->text()); 
strepy(title, title_entry->text()); 

strcpy (catalogue, catalogue_entry~->text ()); 
add_cd(artist, title, catalogue, &cd_id); 


图 17-14 显 示 了 AddCdDialog 的 运行 结果 。 


OLLI AOE ALI IA LALA IF IO LAOS ADIT CI A N, 


Artist (Spinal Tap | 


Titie | 


Catalogue [800005640| | 


iw OK 1} Cancel | 


vv 


图 17-14 


17.7.3 LogonDialog 


当然 ， 你 在 没有 登录 数据 库 的 情况 下 是 不 能 查询 它 的 ， 所 以 你 需要 
一 个 简单 的 对 话 框 来 输入 登录 信息 。 我 们 将 这 个 类 称 为 LogonDialog。 
(1) 首先 是 头 文件 LogonDialog.h。 注 意 : 为 了 寻求 变化 ， 这 里 继 
承 类 QDialog 而 不 是 KDialogBase。 


luđe <qdialog,h> 
include <qli h> 
s LogonDialog public a 
OBJE 
gonD QWidget ent st nane 0) 
S ername { 
r assword( 


private: 


(2) 这 次 ， 你 有 更 好 的 方法 来 管理 用 户 名 和 密码 ， 而 不 是 在 
LogonDialog.cpp 中 封装 database_start 调 用 ， 下 面 是 LogonDialog.cpp 的 代 


*LogonDialog.h* 
“app_mysq! .h* 
<qpushbutton.h> 


<qlayout.h> 
finclude <qlabel.h> 


LogonDialog: :LogonDialog( QWidget *parent, const char *name): QDialog(parent, name) 
{ 
QGridLayout *grid = new QGridLayout(this, 3, 2, 10, 5,*grid"); 


grid->addwWidget (new QLabel ("Username", this, “usernamelabel*), 0, 0, 0); 
grid->addWidget (new QLabel(*Password", this, “passwordlabel"), 1, 0, 0); 


usermame_entry = new QLineEdit( this, "username entry"); 
password_entry = new QLineEdit( this, "password entry"); 
password_entry->setEchoMode (QLineEdit: : Password) ; 


grid->addWidget (username_entry, 0, 1, 0) 
grid->addwWidget (password_entry, 1, 1, 0); 


QPushButton *button = new QPushButton (*Ok*, this, *button"); 
grid->addWidget (button, 2, 1,Qt::AlignRight) ; 


connect (button, SIGNAL(clicked({)), this, SLOT(accept(}))); 
} 
QString LogonDialog: :getUsername ( 
{ 

if (username entry == NULL) 


return NULL; 


return username_entry->text(); 


} 
QString LogonDialog: :getPassword() 
{ 

if (password_entry == NULL) 


return NULL; 


return password_entry~->text(}; 


} 
其 运行 结果 见 图 17-15。 
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17.7.4 main.cpp 


现在 只 剩 下 main 函 数 未 编号 了 ， 你 把 它 放 在 一 个 单独 的 源 文 件 
main.cpp 中 。 
(1) 在 main.cpp 中 ， 你 先 打开 一 个 LogonDialog， 然 后 通过 
database_start 登 录 。 如 果 登 录 失 败 ， 就 将 显示 一 个 QMessageBox， 或 者 
如 果 用 户 想 退出 LogonDialog， 束 将 询问 用 户 是 否 确定 要 退出 。 


@include *MainWindow.h* 
®include *app_mysql.h* 


include “LogonDialog.h* 


#include <kde/kapp.h> 
#include <qmessagebox.h> 


int main( int argc, char **argv ) 


char username [i00); 
char password([100]; 


KApplication al argc, argv, “cdapp* |; 


LogonDialog *dialog = new LogonDialog!); 


if (dialog->exec(|) == QDialog: :Accepted 


strepy(username, dialog->getUsername!)); 


strcpy (password, dialog->getPassword|)); 


if (database_start(username, password) ) 
break; 


QMessageBox::information(0, "Title" 


‘Could not Logon: Check username and/or password’, 
OMessageBox: :Ok); 


if (QMessageBox::information{0, *Title*, 
"Are you sure you want to quit?*, 
QMessageBox: :Yes, QMessageBox: :No) 
as QMessageBox: : Yes) 
return 0; 
} 
delete dialog; 


MainWindow *window = new MainWindow( °Cd App" }; 
window->resize( 600, 400 ); 


a.setMainWidget (| window }; 


window->show(); 


return a.exec(); 


(2) 剩 下 的 就 是 编写 .pro 文 件 ， 并 将 它 传 递 给 qmake。 这 个 文件 名 


为 cdapp.pro: 


ps 


(ka sr/include/mysq) 
QMAK lib 
AK ib/mys 
BS_X11 += -lkdeui -lkdecore -lmysqiclient 
SOURCES = MainWindow.cpp main.cpp app_mysql.cpp AddCdDialog.cpp LogonDialog.cpp 


HEADERS = MainWindow.h app_mysql.h AddCdDialog.h LogonDialog.h 


JER: 这 里 你 只 是 将 app_mysql.c 改 名 为 app_mysql.cpp， 这 样 
它 将 被 看 做 为 一 个 普通 的 C++ 源 文件 。 这 可 以 避免 将 C 语 言 的 目标 
文件 链接 到 C++ 带 来 的 麻烦 。 
如 果 一 切 正常 ， 你 的 CD 数据 库 应 用 程序 就 制作 完成 了 ! 
你 可 能 想 尝 试用 MySQL 接 口 实现 其 他 功能 (如 加 CD 中 添加 曲目 或 
删除 CD) ， 来 进一步 了 解 KDE/Qt。 你 可 以 创建 对 话 框 、 新 的 菜单 项 和 
工具 栏 项 ， 以 及 编写 底层 逻辑 。 尺 管 去 尝试 吧 ! 


17.8 7/2445 


在 本 章 中 ， 你 学 习 了 如 何 使 用 Qt GUI 库 ， 并 看 到 了 KDE 构 件 的 使 
用 情况 。 你 了 解 到 Qt 是 一 个 用 信和 号 / 覃 机 制 来 实现 事件 驱动 编程 的 
C++ 库 。 还 学 习 了 基本 的 Qt 构件 ， 并 且 编 写 了 一 些 示例 程序 ， 了 解 了 如 
ee ea one 
IGUIRI ti o 


4185 Linuxi 


于 inux 网 开始 的 时 候 仅仅 只 是 一 个 内 核 ， 但 内 核 本 身 并 不 是 非常 有 
用 。 我 们 还 需要 许多 其 他 有 用 的 程序 ， 例 如 登录 系统 的 程序 、 管 理 文 件 
的 程序 、 编 译 器 等 。 为 了 使 Linux 系 统 变 得 更 加 有 用 ， 许 多 GNU 项 目的 
工具 被 添加 进来 。 它 们 都 是 当时 在 UNIX 和 类 UNIX 系 统 中 非常 流行 的 程 
序 的 克隆 版 本 。 将 Linux 系 统 变 得 与 UNIX 非 常 相似 设置 了 Linux 的 第 一 
个 标准 ， 它 为 C 语 言 程序 员 提 供 了 一 个 非常 熟悉 的 环境 。 

不 同 的 UNIX (及 其 后 的 Linux) 厂商 为 他 们 所 提供 的 命令 和 工具 添 
加 了 一 些 专 有 的 扩展 ， 而 且 它 们 所 使 用 的 文件 系统 布局 之 间 也 有 一 些 细 
微 的 差别 。 这 使 得 创建 可 以 在 多 个 系统 中 正常 工作 的 应 用 程序 变 得 很 困 
难 。 更 糟 的 是 ， 程 序 员 甚 至 不 能 指望 不 同 的 系统 会 以 相同 的 方式 提供 系 
统 工具 或 配置 文件 在 不 同 的 系统 中 都 位 于 同一 个 位 置 。 

很 显然 ， 我 们 必须 要 建立 一 些 标准 以 避免 UNIX 系 统 的 分 化 ， 目 前 
已 经 完成 了 一 些 优秀 的 UNIX 标 准 化 工作 。 

不 仅 这 些 标 准 在 随 着 时 间 不 断 发展 ， 而 且 Linux 自 身 也 在 随 着 网 络 
社区 〈 通 常 由 商业 组 织 如 Red Hat 和 Canonical， 甚 至 包括 非 Linux 厂 商 
如 IBM 所 支持 〉 的 推动 而 以 尺 人 的 速度 不 断 增强 。 在 发 展 的 过 程 
中 ，Linux 和 GCC 编译 器 集 不 仅 保 持 与 相应 标准 的 一 致 ， 而 且 在 既 有 标 
准 不 满足 需要 时 ， 还 会 有 新 的 标准 推出 。 事 实 上 ， 随 着 Linux 及 其 相关 
工具 和 实用 程序 变 得 越 来 越 流行 ，UNIX 厂 商 已 开始 对 他 们 的 UNIX 系 统 
做 出 修改 ， 以 使 它们 与 Linux 兼 容 性 更 好 。 

在 本 书 的 最 后 一 章 中 ， 我 们 将 介绍 这 些 标准 。 我 们 还 将 给 出 一 些 注 
意 事项 ， 以 便 让 你 编写 的 应 用 程序 不 仅 可 以 在 自己 的 Linux 系 统 〈 包 括 
以 后 的 升级 版 本 ) 中 运行 ， 而 且 可 以 移植 到 其 他 Linux 版 本 ， 甚 至 其 他 
类 UNIX 系 统 中 ， 从 而 与 其 他 用 户 分 享 。 

我 们 将 主要 介绍 以 下 几 方 面 内 容 。 

O CC 编程 语言 标准 。 

O UNIX 标 准 ， 特 别 是 由 IEEE 开 发 的 POSIX 标 准 ， 以 及 由 开放 组 


21 (OpenGroup) 开发 的 单一 UNIX 规 范 。 
O 由 自由 标准 组 织 (Free Standard Group) 所 做 的 工作 ， 特 别 
是 Linux 标 准 化 规范 (Linux ” StandardBase) ， 它 定义 了 标准 的 
Linux 文 件 系 统 布 局 。 
了 解 Linux 相 关 标 准 的 一 个 好 起 点 是 Linux 标 准 化 规范 (LSB)〉， 你 
可 以 通过 访问 Linux 基 金 会 网 站 http: /www.linux-foundatjon.org 来 找到 
Ea 
我 们 并 不 准备 详细 介绍 这 些 标准 的 内 容 ， 其 中 许多 标准 的 内 容 篇 幅 
太 长 。 我 们 将 指出 一 些 关 键 标准 ， 并 介绍 这 些 标准 发 展 的 历史 背景 ， 以 
告诉 你 哪些 标准 对 你 有 用 。 


18.1 C 编 程 语言 


C 语 言 是 Linux 编 程 语言 事实 上 的 标准 ， 所 以 为 了 在 Linux 上 编写 可 
移植 的 C 语 言 程 序 ， 我 们 需要 了 解 一 些 C 语 言 的 起 源 ， 它 是 如 何 发 展 
的 ， 而 更 重要 的 是 如 何 检查 程序 来 保持 和 标准 的 一 致 。 


18.11 % 简介 


那些 对 历史 不 感 兴趣 的 读者 无 需 担 心 ， 因 为 本 书 是 介绍 编程 ， 而 不 
是 讲述 历史 ， 所 以 我 们 只 是 简单 介绍 C 语 言 的 发 展 历史 。 

C 编 程 语言 诞生 于 20 世 纪 70 年 代 ， 它 部 分 基于 早先 的 编程 语 
言 BCPL， 并 对 B 语 言 进行 了 扩展 。DennisM.Ritchie 在 1974 年 为 该 语言 
写 了 一 个 参考 手册 ， 同 一 时 间 ， 对 PDP-11 机 器 上 的 UNIX 内 核 的 改写 也 
是 以 C 语 言 为 基础 的 。1978 年 ，BrianW.Kemighan 和 Ritchie 写 了 一 本 经 
典 的 C 语 言 参考 书籍 《C 编 程 语言 》 (C Programming Language) ， 其 
ee 
LH Fi o 

C 语 言 如 此 快速 地 流行 起 来 ， 毫 无 疑问 这 里 面 有 部 分 原因 应 归功 于 
UNIX 用 户 的 快速 增加 ， 但 也 与 其 自身 强大 的 功能 和 清晰 的 语法 分 不 
开 。C 语 言 的 语法 根据 开发 者 的 共识 也 在 不 断 发 展 ， 但 既然 它 与 原先 参 
考 书 籍 中 所 描述 的 语言 分 蚊 越 来 越 大 ， 很 明显 我 们 需要 一 个 标准 ， 它 既 
符合 当前 的 应 用 ， 又 更 加 精确 。 

1983 年 ，ANSI 建 立 了 X3J11 标 准 委 员 会 来 开发 一 个 清晰 、 简 明 的 C 
语言 定义 。 在 开发 的 过 程 中 ， 他 们 对 Ci 语言 做 了 稍 许 的 改进 ， 特 别 是 增 
加 了 一 个 非常 受 欢迎 的 功能 一 一 声明 参数 类 型 ， 但 总 的 来 说 ， 委 员 会 只 
对 构成 C 语 言 常见 用 法 的 已 有 定义 做 了 阐明 和 合理 化 。 这 个 标准 最 终 
在 1989 年 发 表 了 ， 它 被 称 为 ANSI C 编 程 语言 标准 X3.159-1989， 或 简称 
为 C89， 有 时 又 被 称 为 C90 后 者 后 来 成 为 ISO C 编 程 语言 标准 ISO/IEC 
9899:1990。 这 两 个 标准 在 技术 上 是 相同 的 ) 。 

如 同 大 多 数 标准 一 样 ， 这 个 标准 的 发 表 并 未 结束 委员 会 的 工作 ， 他 
们 继续 努力 以 前 明 在 规范 中 发 现 的 小 的 差异 。1993 年 ， 委 员 会 又 开始 制 
定 下 一 个 版 本 的 标准 ， 即 C9X。 同 时 ， 他 们 还 针对 当前 的 标准 陆续 在 
1994、1995 和 1996 年 发 表 了 小 的 修正 和 更 新 。 

这 个 标准 的 最 新 版 本 出 现在 20 世 纪 90 年 代 ， 它 正式 成 为 C99 标 准 并 
被 ISO 采纳 ， 成 为 ISO/IEC 9899:1999。 目 前 还 有 一 个 工作 委员 会 J11 在 继 
续 进 行 C 语 言及 其 函数 库 的 标准 化 研究 ， 但 它 现 在 是 在 国际 委员 会 下 为 


言 息 技 术 标 准 组 工作 。 你 可 以 通过 网 址 http:Wj11.incits.org/ 找 到 更 多 有 关 
当前 C 语 言 标 准 化 工作 的 信息 。 


18.1.2 ”GNU 编译 器 集 


开发 了 Emacs 编辑 器 〈 是 的 ， 我 们 爱 Emacs) 后 ，GNU 项 目的 下 一 
个 主要 成 就 (正如 我 们 在 第 1 章 讨论 的 ) 是 一 个 完全 免费 的 C 语 言 编译 
器 gcc， 它 的 第 一 个 正式 版 本 发 表 于 1987 年 。 

gcc 最 初 只 是 一 个 GNU “C 语 言 的 编译 器 ， 但 由 于 目前 该 编译 器 的 基 
本 框架 已 支持 Ct++、Object-C、FORTRAN、Java 和 Ada 等 许多 其 他 编 
3 言及 其 函数 库 ， 所 以 对 gcc 的 定义 被 修改 为 更 合适 的 GNU 编 译 器 


gcc 始 终 是 ， 并 且 看 来 以 后 也 将 会 是 Linux 上 的 标准 编译 器 ， 并 且 C 
或 C++ 语言 也 是 Linux 上 程序 设计 的 基本 语言 。 更 多 信息 可 参见 gcc 的 主 
页 http://gcc.gnu.org。 

GNUC 语 言 编译 器 总 是 非常 好 地 保持 与 C 语 言 标准 开发 进度 的 一 
致 ， 同 时 它 也 允许 一 些 扩展 功能 ， 并 且 不 可 避免 地 像 所 有 其 他 编译 右 一 
样 ， 在 标准 正式 推出 和 编译 器 完全 实现 该 标准 之 间 有 稍微 的 延迟 。 但 有 
时 也 会 出 现 相 反 的 情况 ，gcc 期 望 标准 能 稍 作 一 些 修改 ， 这 一 点 也 让 人 
非常 困惑 。gcc 包 含 许 多 命令 行 命令 和 选项 ， 它 们 允许 你 指定 希望 gcc 遵 
守 的 C 语 言 标准 版 本 ， 以 及 控制 编译 器 审查 程序 语法 时 的 严格 程度 。 


18.1.3 ”gcc 选项 


在 了 解 了 一 些 C 语 言 标 准 发 展 的 背景 之 后 ， 现 在 我 们 来 查看 gcc 编 译 
妖 提 供 的 一 些 选 项 ， 它 们 可 以 用 来 确保 我 们 所 编写 的 C 语 言 程 序 是 完 
遵守 该 语言 的 标准 的 。 我 们 可 以 用 3 种 方法 来 确保 编写 的 C 语 言 代 码 不 仅 
遵守 标准 ， 而 且 还 是 代码 清晰 的 。 它 们 是 : 用 可 以 控制 标准 版 本 的 选项 
来 指定 我 们 期 望 代 码 兼 容 的 标准 版 本 ; 定义 用 来 控制 头 文 件 的 常量 ， 用 
警告 选项 对 代码 进行 更 严格 的 检查 。 

gcc 编 译 右 包含 有 大 量 的 选项 ， 在 这 里 ， 我 们 将 只 介绍 那些 最 重要 
的 选项 。 完 整 的 选项 列表 可 以 在 gcc 手 册页 中 找到 。 我 们 还 将 简单 介绍 
一 些 可 以 使 用 的 #define 选 项 ， 它 们 通常 必须 在 源 代码 中 的 任何 #include 
语句 之 前 设置 或 在 gcc 命 令 行 上 定义 。 你 可 能 会 感到 惊讶 ， 为 什么 需要 
用 这 么 多 选项 来 选择 一 个 要 使 用 的 标准 ， 而 不 能 只 用 一 个 标记 来 强制 使 
用 当前 的 标准 昵 ? 原因 是 ， 由 于 许多 以 前 的 程序 依赖 编译 器 的 历史 行 
为 ， 如 果 要 将 它们 全 部 更 新 到 遵守 最 新 的 标准 ， 我 们 需要 付出 巨大 的 努 
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代码 ， 而 且 随 着 标准 的 发 展 ， 我 们 希望 编译 器 能 够 针对 特定 的 标准 正常 
工作 ， 即 使 它 并 不 是 最 新 版 本 的 标准 。 

即使 仅仅 是 为 个 人 使 用 而 编写 一 个 小 的 程序 ， 在 这 种 情况 下 ， 虽 然 
让 程序 遵守 标准 显得 并 不 是 那么 重要 ,但 仍然 值得 在 编译 时 局 用 更 多 的 
gcc 冤 告 选项 ， 因 为 这 样 可 以 让 编译 占 在 真正 运行 程序 之 前 找 出 程序 代 
码 中 的 错误 。 与 使 用 调试 器 以 步 进 的 方式 来 伍 找 代码 问题 相 比 ， 使 用 这 
种 方式 更 有 效 京 。 编 译 器 包括 很 多 选项 ， 它 们 的 功能 不 仅仅 只 是 检查 代 
码 是 否 遵 守 标 准 的 规定 ， 而 且 还 可 以 检查 出 虽然 体 守 标准 但 可 能 包含 歧 
义 的 代码 。 例 如 ， 代 码 中 可 能 存在 一 个 执行 序列 ， 它 将 允许 变量 在 未 初 
始 化 之 前 就 被 访问 。 

如 果 确 实 需 要 将 编写 的 代码 与 他 人 分 享 ， 除 了 在 编译 时 选择 需要 遵 
守 的 标准 版 本 和 合适 的 警告 选项 外 ， 还 有 非常 重要 的 一 点 是 ， 要 努力 确 
保 你 的 代码 在 编译 时 没有 任何 警告 信息 出 现 。 如 条 你 在 编译 时 允许 出 现 
些 警 告 信 息 并 且 养 成 习惯 忽略 它们 ， 那 么 当 有 一 天 在 编译 时 出 现 非 常 
严重 的 警告 信息 时 ， 你 也 可 能 会 把 它 忽略 。 如 果 代 码 在 编译 时 永远 都 保 
持 整 洁 ， 那 么 当 出 现 新 的 警告 信息 时 ， 它 就 会 显得 非常 明显 。 我 们 应 该 
养 成 保持 编译 代码 整洁 的 习惯 。 
1. 控制 标准 版 本 的 编译 选项 
这 些 选 项 在 命令 行 上 传递 给 gcc。 我 们 只 在 下 面 讲解 那些 最 重要 的 


选项 


口 -ansi: 这 是 最 重要 的 标准 选项 ， 它 告诉 编译 器 遵守 C 语 言 的 ISO 
C90 标 准 。 它 关闭 那些 与 标准 不 兼容 的 gcc 扩 展 ， 禁 用 C 语 言 程序 中 
的 C++ UO 风格 注释 ， 并 启用 ANSI 的 三 字母 词 〈trigraph) 特性 。 
同时 通过 定义 宏 _STRICT_ANSI 来 关闭 在 头 文件 中 与 标准 不 兼容 
I 
言 标准 。 

o -std=: 通过 这 个 选项 可 以 对 使 用 的 标准 进行 更 精细 地 控制 ， 它 
通过 使 用 一 个 参数 来 设置 需要 的 标准 。 其 主要 的 选项 如 下 所 示 。 


m c89: 文 持 C89 标 准 。 

m iso9899:1999: 支持 最 新 的 ISO C90 标 准 。 

m gnu89: 支持 C89 标 准 ， 但 同时 支持 GNU 的 扩展 和 一 些 C99 特 
性 。 对 于 gcc 的 4.2 版 本 来 说 ， 这 是 默认 行为 。 


2. 控制 标准 版 本 的 常量 
这 些 常量 〈f#define) 可 以 通过 编译 器 的 命令 行 选项 来 设置 ， 或 者 通 


过 源 代 码 中 的 #define 语 句 来 定义 。 我 们 通常 建议 用 前 者 设置 这 些 常 量 。 


Mia 


O _STRICT_ANTI :强制 使 用 C 语 言 的 ISO 标准 。 这 个 常量 在 使 用 
编译 器 的 命令 行 选项 -ansi 时 被 定义 。 

O _POSIX_C SOURCE=2: 启用 由 IEEE Std 1003.1 和 1003.2 标 准 定 
义 的 特性 。 我 们 还 会 在 本 章 后 面 的 内 容 中 谈 到 这 些 标准 。 

口 “BSD_ SOURCE: 启用 BSD 类 型 的 特性 。 如 果 这 些 特性 与 
POSIX 定 义 冲突 ， 则 以 BSD 的 定义 为 准 。 

O _GNU_SOURCE: 启用 大 量 特 性 ， 其 中 包括 GNU 扩 展 。 如 果 这 
些 特 性 与 POSIX 定 义 冲突 ， 则 以 POSIX 定 义 为 准 。 

3. 编译 器 的 警告 选项 

这 些 选 项 在 编译 器 的 命令 行 上 传递 。 我 们 在 下 面 只 列 出 主要 的 选 
完整 的 选项 列表 可 以 在 gcc 的 手册 页 中 找到 。 

O -pedantic: 这 是 用 于 检查 C 语 言 代码 的 功能 最 强大 的 编译 器 选 
项 。 它 除了 启用 用 于 检查 代码 是 否 遵 守 C 语 言 标 准 的 选项 外 ， 还 关 
闭 了 一 些 不 被 标准 允许 的 传统 C 语 言 结构 ， 并 且 禁 用 所 有 的 GNU 扩 
展 。 如 果 你 希望 代码 能 够 尽 可 能 地 做 到 可 移植 ， 就 需要 使 用 这 个 选 
项 。 这 个 选项 的 缺点 是 ， 它 在 检查 代码 时 显得 非常 挑剔， 有 时 你 不 
得 不 非常 仔细 地 思考 ， 以 去 除 那 些 最 后 的 警告 信息 。 

O -Wformat: 检查 printf 系 列 函 数 所 使 用 的 参数 类 型 是 否 正 确 。 

O -Wparentheses: 检查 是 否 总 是 提供 了 需要 的 圆 括号 ， 即 使 在 某 
些 环境 中 并 不 是 必须 要 使 用 它们 。 当 想 要 检查 对 一 个 复杂 结构 的 初 
始 化 是 否 按 照 预 期 进行 时 ， 这 个 选项 就 很 有 用 。 

口 -Wswitch-default: 检查 是 否 所 有 的 switch 语 句 都 包含 一 个 default 
case， 这 通常 是 一 个 好 的 编码 习惯 。 

口 -Wunused: 检查 诺 如 声明 静态 函数 但 没有 定义 、 未 使 用 的 参数 
和 丢弃 返回 结果 等 情况 。 

O -Wall: 启用 绝 大 多 数 gcc 的 警告 选项 ， 包 括 所 有 以 -W 为 前 级 的 
选项 (不 包括 选项 -pedantic) ， 这 个 选项 对 保持 代码 的 整洁 很 有 


用 。 

gcc 还 包括 许多 警告 选项 ， 详 细 情 况 请 阅读 gcc 的 网 页 。 一 般 来 说 ， 
我 们 建议 使 用 选项 -Wal， 它 在 检查 代码 质量 和 不 让 编译 此 生成 太 
多 的 琐 雁 警告 之 间 达 到 了 很 好 的 平衡 ， 因 为 要 清除 邱 这 些 琐碎 的 警 
告 需 要 耗费 程序 员 太 多 的 精力 。 
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现在 我 们 将 讨论 比 C 语 言 代码 高 一 个 层次 的 由 操作 系统 提供 的 接口 
(系统 函数 ) 。 这 一 级 别 的 标准 化 工作 由 下 面 两 个 组 件 构 成 : 由 函数 库 
提供 的 函数 和 由 底层 的 操作 系统 提供 的 系统 调用 。 在 这 两 个 组 件 之 中 又 
分 别 包含 两 个 层次 的 细 市 : 提供 的 是 哪 一 个 接口 和 接口 的 定义 。 

在 这 一 领域 的 针对 Linux 的 权威 性 文档 是 LSB， 你 可 以 在 
http://www. linuxbase.org=khttp://www.linux-foundation.org/en/LSB_-4k 4!) 
它 。 该 标准 已 发 布 了 多 个 版 本 ， 其 工作 还 正在 进行 之 中 。 

你 可 以 在 http:/www.linux-foundation.org/en/products 上 找到 通过 验证 
的 Linux 发 行 版 列表 。RedHat、SUSE 和 Ubuntu 的 各 种 版 本 都 通过 了 验 
证 ， 但 请 记 住 ， 一 个 发 行 版 在 发 布 之 后 需要 经 过 一 段 时 间 的 测试 来 通过 
验证 。 这 个 站 点 还 列 出 了 正 处 于 测试 中 的 发 行 版 ， 以 及 需要 进行 一 些 更 
新 才能 通过 验证 测试 的 发 行 版 。 

Linux 标 准 化 规范 (版 本 3.1) 定义 了 3 个 需要 遵守 的 领域 。 

OD 核心 : 主要 的 函数 库 、 工 具 和 一 些 重要 的 文件 系统 位 置 。 

O C++: C++ RUF. 

O RE: 用 于 蝎 面 安装 的 其 他 文件 ， 主 要 是 各 种 图 形 库 。 

我 们 感 兴趣 的 主要 领域 是 这 个 规范 的 核心 部 分 。 

LSB 规 范 在 其 自身 的 文档 中 闻 盖 了 许多 领域 ， 同 时 它 还 引用 了 一 些 
针对 特定 接口 定义 的 外 部 标准 。 其 涵盖 的 领域 包括 : 

可 兼容 二 进 制程 序 的 对 象 格式 ; 

动态 链接 标准 ; 

标准 函数 库 ， 包 括 基础 函数 库 和 X 视 窗 系 统 函 数 库 ; 
shell 和 其 他 命令 行程 序 ; 

执行 环境 ， 包 括 用 户 和 组 ; 

系统 初始 化 和 运行 级 别 。 

在 本 章 中 ， 我 们 只 对 标准 函数 库 、 用 户 和 系统 初始 化 感 兴趣 ， 所 以 
这 也 是 下 面 将 要 介绍 的 内 容 。 
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LSB 定 义 了 必须 以 两 种 方式 呈现 的 接口 。 对 于 那些 主要 是 由 GNU C 
函数 库 实 现 的 或 试图 成 为 Linux 专 属 标准 的 函数 ， 它 定义 接口 及 其 行 
为 。 对 于 主要 来 自 UNIX 系 统 的 其 他 接口 ， 规 范 只 是 说 明 必 须 存 在 一 个 
特定 接口 ， 并 且 该 接口 的 行为 必须 与 其 他 标准 定义 的 一 样 ， 这 里 所 说 的 


其 他 标准 通常 指 的 是 公共 应 用 环境 (Common Application Environment, 
CAE) 或 更 常见 的 单一 UNIX 规 范 (Single UNIX Specification) 。 后 者 
的 网 址 为 http://www.opengroup.org， 其 中 一 部 分 内 容 可 以 通过 
http://www.unix.org/online.html (需要 注册 ) 访问 。 

但 遗憾 的 是 ，Linux 的 底层 标准 ， 即 UNIX 标 准 的 历史 非常 复杂 ， 存 
在 相当 多 的 标准 可 供 选 择 ， 虽 然 其 中 大 部 分 标准 的 不 同 版 本 之 间 的 兼容 
性 都 很 好 。 

1. UNIX 标 准 历史 简介 

UNIX 诞 生 在 20 世 纪 60 年 代 末 的 AT&T 公 司 的 贝尔 实验 室 。 最 初 ， 
Ken Thompson 和 Dennis Ritchie 只 是 处 于 个 人 使 用 的 目的 编写 了 一 个 操作 
系统 并 将 其 命名 为 Unics， 不 知 何故 这 个 名 字 后 来 又 被 更 名 为 UNIX。 
AT&T 公 司 允 许 大 学 获取 该 操作 系统 的 源 代 码 来 进行 研究 ， 并 且 由 于 
UNIX 非 常 整洁 的 设计 和 强大 的 概念 ， 它 很 快 融 变 得 非 铝 流行 。 开 放 源 
代码 也 产生 了 非常 重大 的 意义 ， 因 为 它 人 允许 人 们 对 其 进行 修改 和 实验 。 

BSD 操 作 系 统 作 为 UNIX 系 统 的 一 个 分 文 ， 由 加 州 大 学 伯克利 分 校 
开发 ， 其 中 的 许多 工作 主要 集中 在 操作 系统 的 网 络 功 能 上 。 

当 AT&T 公 司 在 20 世 纪 80 年 代 中 期 开始 将 UNIX 系 统 商业 化 时 ， 它 
对 其 发 布 的 UNIX 系 统 进行 了 命名 ， 其 中 最 流行 的 一 个 版 本 是 UNIX 
System V 。 

与 此 同时 ， 也 出 现 了 许多 其 他 的 UNIX 分 文 ， 数 量 太 多 ， 我 们 就 不 
在 这 里 一 一 列 出 了 。 这 些 UNIX 分 文 都 与 UNIX 基 本 的 标准 有 些 细微 的 区 
2 因为 公司 一 般 都 会 尝试 通过 私有 扩展 来 增加 操作 
系统 的 功能 。 

1994 年 ， 当 AT&T 决 定 退 出 UNIX 产 业 并 将 它 的 UNIX 系 统 实验 室 卖 
给 Novell 公 司 之 后 ， 情 况 开 始 变 得 真正 复杂 起 来 ，UNIX 隘 标的 所 有 权 
变 得 有 些 混乱 ， 并 成 为 了 各 种 诉讼 案件 的 主题 。1988 年 ， 

IEEE Chttp://www.ieee.org) 发 表 了 一 系列 UNIX 标 准 中 的 第 一 个 标准 
POSIX《〈 又 被 称 为 IEEE1003 标 准 ) ， 它 试图 成 为 权威 性 的 针对 计算 机 环 
境 的 可 移植 接口 规范 。 虽 然 它 是 一 个 好 的 、 定 义 明确 的 标准 ， 但 同时 它 
也 是 一 个 非常 核心 的 规范 并 且 它 所 涵盖 的 范围 也 非常 有 限 。 

1994 年 ，X/OPEN 公 司 作为 一 个 广 商 中 立 的 机 构 ， 发 表 了 一 组 较 大 
规模 的 规范 XIOPEN CAE《〈 又 被 称 为 公共 应 用 环境 ) ， 它 是 IEEE POSIX 
标准 的 一 个 超 集 并 且 从 技术 角度 来 说 有 很 多 领域 与 它 相 同 。X/OPEN 公 
司 后 来 和 OSF 合 并 成 并 了 Open Group， 它 的 网 址 是 
http://www.opengroup.org/。CAE 标 准 在 2002 年 被 更 新 并 以 单一 UNIX 规 
范 版 本 3 的 形式 由 Open Group 发 表 。 

单一 UNIX 规 范 是 Linux 标 准 化 规范 最 常 参考 的 一 个 规范 。 


注意 ，“Linux” 是 一 个 由 Linus Torvalds 拥 有 的 商标 〈 见 
http://www.linuxmark.org/) 。 


2. 针对 函数 库 使 用 LSB 标 准 

上 一 节 的 介绍 对 读者 了 解 UNIX 标 准 的 历史 已 经 足够 ， 但 这 对 那些 
希望 自己 编写 的 C 语 言 〈 或 C++ 语言 ) 的 程序 可 移植 的 程序 员 来 说 意味 
着 什么 呢 ? 

首先 ， 需 要 检查 你 所 使 用 的 库 函 数 是 否 被 列 在 了 LSB 规 范 中 。 如 果 
它 不 在 这 个 规范 中 ， 你 所 编写 的 程序 就 可 能 不 会 那么 容易 地 被 移植 ， 这 
时 就 需要 查找 一 种 标准 的 方法 来 执行 你 想 要 完成 的 工作 。 你 可 能 需要 用 
Linux 命 令 apropos 来 搜索 在 线 手册 页 ， 以 找到 合适 的 帮助 页 面 。 

其 次 ， 也 是 更 困难 的 一 步 ， 就 是 检查 你 所 使 用 的 函数 行为 是 否 是 规 
范 定义 的 行为 ， 并 且 没 有 在 程序 中 依赖 系统 特定 的 函数 行为 。 如 果 函 数 
的 用 法 未 在 LSB 中 定义 ， 你 可 能 不 得 不 参考 单一 UNIX 规 范 来 检查 。 

用 于 检查 未 定义 或 可 能 产生 错误 行为 的 函数 的 一 个 非常 好 的 方法 是 
使 用 Linux 的 在 线 手 册 。 手 册 中 的 许多 页 面 都 包含 一 个 BUGS (漏洞 ) 小 
节 ， 它 是 一 个 无 价 的 信息 来 源 。 它 可 以 告诉 我 们 ，Linux 中 的 某 个 特定 
函数 调用 可 能 没有 完全 按照 标准 中 的 定义 来 实现 ， 或 者 它 在 执行 时 有 一 
些 已 知 的 漏洞 或 奇怪 的 行为 。 


18.2.2 LSB 用 户 和 组 


规范 中 这 一 部 分 的 内 容 非常 简明 且 容 易 理解 。 下 面 是 一 些 规范 中 的 


定义 。 
O 它 告诉 我 们 ， 一 定 不 能 直接 读 取 如 /etc/passwd 这 样 的 文件 ， 而 
是 应 该 总 是 使 用 如 getpwent 这 样 的 标准 库 函 数 调 用 或 者 如 passwd 这 
样 的 标准 工具 来 访问 用 户 详 细 信 息 。 

口 ” 它 告诉 我 们 ， 在 root 组 中 必须 有 一 个 名 为 root 的 用 户 ， 这 个 root 
用 户 是 一 个 拥有 全 部 权限 的 管理 员 。 同 时 还 有 一 组 可 选 的 用 户 和 组 
a a 它们 由 Linux 发 行 版 自身 来 使 


口 “ 它 还 告诉 我 们 ， 用 户 ID 小 于 100 的 账号 是 系统 账号 ， 用 户 ID 在 

100 到 499 之 则 的 账号 是 由 系统 管理 员 和 安装 后 脚本 分 配 的 ， 用 户 ID 

在 500 及 其 以 上 的 账号 用 于 普通 用 户 。 

一 般 来 说 ， 上 面 这 些 内 容 对 大 多 数 需要 了 解 用 户 标 准 的 Linux 程 序 
员 来 说 已 足够 。 


18.2.3 LSB 系 统 初 始 


至 少 对 于 我 们 来 说 ， 系 统 初 始 化 方面 的 内 容 总 是 一 件 在 不 同 Linux 
发 行 版 之 间 有 着 细微 区 别 的 让 人 烦恼 的 事情 。 
Linux 继 承 了 类 UNIX 操 作 系统 运行 级 别 的 思想 ， 运 行 级 别 定 义 了 在 
对 于 Linux 来 说 ， 第 见 的 运行 级 别 定 义 见 
18-1. 


表 18-1 


SHE. AE 


LSB 列 出 了 这 些 运行 级 别 ， 但 并 不 要 求 使 用 它们 ， 但 实际 上 它们 是 
非常 常见 的 。 

与 这 些 运行 级 别 相 伴 的 是 一 组 用 于 启动 、 关 闭 和 重启 服务 的 初始 化 
脚本 。 以 前 的 Linux 系 统 会 将 这 些 脚 本 放 在 /etc 目 录 下 的 不 同位 置 ， 一 般 
是 放 在 目录 /etc/init.d 或 /etc/rc.d/init.d 下 。 这 种 不 确定 性 通常 让 用 户 
惑 ， 因 为 当 他 们 更 换 了 Linux 发 行 厂 后 ， 他 们 融 不 能 在 期 望 的 目录 下 找 
到 初始 化 脚本 了 ， 而 且 在 安装 程序 时 ， 当 你 试图 将 初始 化 脚本 放 在 一 个 
错误 的 目录 下 时 ， 也 会 导致 安装 程序 失败 。 

LSB 3.1 将 这 些 初始 化 脚本 放置 的 目录 定义 为 /etcwinitd， 但 它 也 人 允许 
这 个 目录 可 以 是 对 其 他 目录 的 一 个 连接 。 

在 /etc/init.d 目 录 中 的 每 个 脚本 都 有 一 个 与 其 提供 的 服务 相关 联 的 名 
字 。 由 于 这 是 在 Linux 系 统 中 所 有 服务 必须 共享 的 一 个 公用 命名 空间 ， 

所 以 保证 名 字 的 唯一 性 是 非常 重要 的 。 例 如 ， 如 果 MySQL 和 了 PostgreSQL 
都 决定 将 它们 的 脚本 命名 为 database， 那 么 情况 就 会 变 得 比较 复杂 。 为 
了 避免 发 生 这 样 的 冲突 ， 我们 还 有 男 外 一 组 标准 ， 它 就 是 “Linux 分 配 名 
字 和 数字 机 构 ”(Linux Assigned Names And Numbers Authority， 简 称 为 
LANANA) ， 它 的 网 址 为 http://www.lanana.org/。 幸 运 的 是 ， 你 不 需要 
对 它 了 解 太 多 ， 只 需要 知道 它 维护 了 一 个 已 注册 脚本 和 软件 包 名 字 列 
表 ， 从 而 减轻 了 Linux 系 统 用 户 的 工作 负担 。 

初始 化 脚本 必须 用 一 个 参数 来 控制 它 的 行为 。 已 定义 的 参数 见 表 
18-2. 


表 18-2 


6 至 iR 时 7 
“start | ay (MET) 服务 
stop MERS 
restart KARP MAM URAA ORN 
reload RRRA, PER BA EAR FERNER ASR, HEA ENA L EE titt. 
所 以 这 个 参数 可 能 并 不 能 被 所 有 的 靶 本 所 支持 ， 或 者 是 矶 热 被 妓 本 接受 ， 介 不 会 产生 任何 效果 
force-reload ip RE PPLE RTE. OY pan %, GM. ARE rT 


s UTEHRIE 1p ARATE . we 4s Go] DFA be A HAR AAR 
ai ee then Dane al A A 


所 有 的 全 令 在 成 功 时 返回 0， 失败 时 返回 表明 错误 原因 的 错误 代 
码 。 使 用 status 参 数 时 ， 如 有 果 服 务 正 在 运行 则 返回 0， 否 则 返回 表明 服务 
没有 i 运行 原因 的 状态 人 码 。 


18.3 3 RVR Za KA on i 


在 本 章 中 我 们 要 介绍 的 最 后 一 个 标准 是 文件 系统 层次 结构 标准 
(Filesystem Hierarchy Standard， 简 称 为 FHS) ， 它 的 网 址 为 
http://www.pathname.com/fhs/. 

这 个 标准 的 目的 是 定义 Linux 文 件 系 统 的 标准 路 径 ， 使 得 开发 者 和 
用 户 可 以 在 合理 的 位 置 找 到 需要 的 东西 。 长 期 以 来 ， 使 用 不 同类 UNIX 
操作 系统 的 用 户 都 对 文件 系统 布局 的 细微 区 别 感 到 无 条， 而 FHS 问 
Linux 发 行 版 提供 了 一 种 方法 来 避免 这 样 的 问题 。 

乍 看 起 来 ，Linux 系 统 中 的 文件 布局 好 像 是 对 文件 和 目录 基于 历史 
实践 的 一 种 比较 随意 的 安排 。 从 某 种 程度 上 来 说 ， 事 实 确实 如 此 ， 但 这 
种 布局 是 经 过 多 年 的 合理 演变 才 形 成 我 们 今天 见 到 的 构架 的 。 大 体 的 想 
法 是 将 文件 和 目录 分 为 如 下 3 组 。 

O 对 运行 Linux 的 茶 一 特定 系统 唯一 的 文件 和 目录 ， 例 如 局 动 脚本 

和 配置 文件 。 

O 可 以 在 运行 Linux 的 不 同系 统 之 间 共 至 的 只 读 文 件 和 目录 ， 例 如 

可 执行 应 用 程序 。 

O 可 以 在 运行 Linux 或 其 他 操作 系统 的 不 同系 统 之 间 共 至 的 可 读 可 

写 的 目录 ， 例 如 用 户 家 目录 。 

虽然 ， 在 一 个 由 Linux 机 器 组 成 的 网 络 中 ， 确 保 只 有 一 份 主要 程序 
目录 的 副本 ， 并 且 可 以 在 许多 机 器 之 间 共 享 是 非常 好 的 做 法 ， 但 在 本 书 
中 ， 我 们 对 在 不 同 版 本 的 Linux 系 统 之 间 共 享 文件 并 不 是 太 感 兴趣 。 这 
种 做 法 只 对 无 盘 工 作 站 特别 有 用 。 

FHS 定 义 的 顶级 结构 包含 一 些 必须 存在 的 子 目录 和 一 小 部 分 可 选 的 
目录 ， 如 表 18-3 所 示 。 


表 18-3 


另外 ， 可 能 还 会 有 一 些 其 他 目录 也 以 lb 为 前 经， 但 这 并 不 是 很 党 
见 。 你 通常 还 会 看 到 目录 /lost+found (用 于 fsck 命 令 进行 文件 系统 的 恢 
复 ) 和 目录 /proc， 后 者 其 实 是 一 个 伪 文 件 系统 ， 它 提供 了 对 当前 运行 系 
统 的 一 个 映射 。 当 前 的 FHS 标 准 提 到 了 /proc 文 件 系 统 ， 但 并 不 要 求 它 一 
定 存在 。 虽 然 我 们 在 第 4 章 简 单 介绍 了 /proc 目 录 ， 但 关于 它 的 细节 已 超 
出 了 本 书 介 绍 的 范围 。 

下 面 ， 我 们 将 简单 介绍 根 目 录 下 每 个 标准 子 目录 的 用 途 。 

O bin: 包含 可 以 被 root 用 户 和 普通 用 户 使 用 的 二 进 制 文件 ， 它 们 

都 可 以 在 单 用 户 模式 下 运行 ， 即 在 其 他 一 些 目录 结构 还 未 装载 的 情 

况 下 也 能 单独 运行 。 例 如 ， 核 心 命令 如 cat 和 ls 都 可 以 在 这 里 找到 ， 

当然 也 包括 命令 sh。 

O /boot: 这 个 目录 下 放置 的 是 启动 Linux 系 统 时 所 需 使 用 的 文件 。 

这 些 文件 通常 都 比较 小 ， 文 件 长 度 不 超过 100MB。 我 们 通常 会 为 这 

个 目录 单独 划分 一 个 分 区 ， 在 基于 PC 的 系统 中 这 样 做 非常 方便 ， 

但 由 于 BIOS 通 常会 对 活动 分 区 有 所 限制 ， 所 以 需要 将 该 分 区 分 配 

在 人 磁盘 的 前 2G 或 4G 空 间 中 。 为 这 个 目录 单独 划分 一 个 分 区 ， 可 以 

使 我 们 在 决定 如 何 分 配 剩余 的 磁盘 空间 时 更 灵活 。 

口 /dev: 这 个 目录 下 放置 的 是 映射 到 硬件 的 特殊 设备 文件 。 例 

如 /dev/hda 将 映射 到 第 一 个 IDE 人 磁盘。 

口 /etc: 这 个 目录 下 放置 的 是 配置 文件 。 历 史上 有 些 二 进 制 文 件 也 

放置 在 这 个 目录 下 ， 但 在 现在 的 大 多 数 Linux 系 统 中 都 不 会 再 出 现 

这 种 情况 。 在 /etc 目 录 下 最 有 名 的 文件 可 能 就 是 passwd 文 件 ， 它 包 

含 系 统 中 用 户 的 信息 。 其 他 有 用 的 文件 有 fstab( 列 出 分 区 装载 选 

项 ) 、hosts《 列 出 IP 地 址 和 主机 名 的 映射 关系 ) 、httpd 目 录 (包含 

Apache 服 务 器 的 配置 文件 )。 


O /home: 这 是 用 于 放置 用 户 文件 的 目录 。 正 常情 况 下 ， 每 个 用 户 

都 会 在 这 个 目录 下 有 一 个 与 他 们 的 登录 名 相同 的 子 目 录 ， 而 这 个 子 

目录 束 是 他 们 的 默认 登录 目录 。 例 如 ， 用 户 rick 在 登录 进 系统 后 ， 

将 会 发 现 上 自己 位 于 目录 /home/rick 中 。 

O /ib: 这 个 目录 下 放置 的 是 基本 的 共享 水 数 库 和 内 核 模块 ， 特 别 

是 那些 在 系统 局 动 或 系统 位 于 单 用 户 模式 时 需要 用 到 的 文件 。 

O /media: 这 个 顶级 目录 用 于 包含 装载 可 移动 媒体 的 其 他 子 目 

录 。 其 目的 是 消除 不 必要 的 顶级 目录 ， 如 /cdrom 和 /floppy。 

口 /mnt: 这 个 目录 只 是 用 来 方便 用 户 临 时 装载 一 些 其 他 的 文件 系 

统 。 以 前 ， 一 些 Linux 发 行 版 还 会 在 该 目录 中 针对 不 同 的 设备 添加 

一 些 子 目 录 ， 如 /mnt 目 录 下 的 cdrom 和 floppy 子 目录 ， 但 现在 用 于 装 

载 这 些 设备 的 首选 位 置 是 在 /media 目 录 下 ，/mnt 目 录 将 作为 一 个 顶 

级 的 临时 装载 位 置 。 

O /opt: 软件 厂商 在 问 系 统 中 添加 软件 时 会 用 到 这 个 目录 。 按 照 惯 

例 ，Linux 发 行 版 一 般 不 会 将 自己 发 布 的 软件 放置 在 这 个 目录 下 ， 

而 是 将 这 个 目录 开放 给 第 三 方 厂商 来 使 用 。 广 商 通 和 会 在 这 个 目录 

下 以 它们 的 名 字 创 建 一 个 子 目 录 ， 然 后 针对 它们 的 应 用 程序 ， 在 这 

个 子 目 录 下 继续 创建 如 /bin 和 /lib 等 子 目录 。 

nals iA 大 多 数 开放 源码 的 Linux 软 件 包 将 目录 /usr/local 作 为 它们 

O /root: 这 个 目录 下 放置 的 是 root 用 户 使 用 的 文件 。 它 并 没有 放置 

在 /home 目 录 下 的 原因 是 ， 在 单 用 户 模 式 下 ，/home 目 录 可 能 未 被 装 

O /sbin: 这 个 目录 下 放置 的 是 通常 只 能 由 系统 管理 员 使 用 的 命 

令 ， 以 及 在 系统 启动 时 或 进入 单 用 户 模式 时 需要 使 用 的 命令 。 命 令 

fsck、halt 和 swapon 等 就 在 这 个 日 录 中 。 

口 /srv: 这 个 目录 用 于 放置 站 点 特定 的 只 读 配 置 数据 ， 但 它 目 前 还 

未 被 普遍 使 用 。 

O /tmp: 这 个 目录 下 放置 的 是 临时 文件 。 系 统 通 常会 在 (但 并 不 

总 是 ) 局 动 时 清理 这 个 目录 。 

O /usr: 这 是 一 个 相当 复杂 的 二 级 文件 系统 ， 在 这 个 目录 下 ， 通 和 

将 包含 除 在 系统 启动 或 进入 单 用 户 模 式 所 需要 的 文件 以 外 的 所 有 系 

统 类 的 命令 和 函数 库 。 它 包含 许多 子 目 录 ， 如 /bin、/lib、/X11R6 

和 /local。 

在 UNIX 和 Linux 发 展 的 早期 ，/usr 目 录 下 还 有 用 于 记录 日 志和 放置 
邮件 队列 等 的 子 目 录 ， 但 现在 它们 都 已 经 从 usr 目 录 下 移出 并 放置 到 var 
目录 中 。 这 样 做 的 好 处 是 ，msr 目 录 作 为 一 个 可 装载 的 文件 系统 ， 可 以 


在 大 部 分 时 间 里 以 只 读 的 方式 装载 到 系统 中 。 当 /usr 目 录 以 只 读 方 式 装 

载 时 ， 它 可 以 通过 网 络 与 其 他 系统 共享 ， 而 且 当 系 统 由 于 一 些 不 可 控制 

的 原因 ， 如 断 电 而 造成 集 机 时 ， 这 个 目录 中 的 内 容 也 不 容易 遭 到 损坏 。 
O War: 这 个 目录 下 放置 的 数据 是 会 经 第 改变 的 ， 如 用 于 打印 的 队 
列 文件 、 应 用 程序 的 日 志文 件 和 邮件 队列 目录 等 。 


18.4 A: 


如 果 你 想 编写 和 分 发 一 个 具备 完全 可 移植 性 的 Linux 应 用 程序 ， 除 
了 上 面 所 介绍 的 内 容 外 ， 当 然 还 需要 考虑 许多 其 他 事情 。 

你 想 本 地 化 应 用 程序 ， 让 和 它 可 以 在 不 同 的 地 点 、 使 用 不 同 的 语言 运 
行 吗 ?即使 你 在 程序 中 坚持 使 用 秽语， 你 仍然 需要 考虑 如 货币 、 数 字 分 
阳 符 和 日 期 格式 等 许多 其 他 问题 。 你 猜 对 了 ， 人 们 正在 对 这 些 事 务 进行 
标准 化 ， 你 可 以 访问 http://www.openil8n.org/ 来 查看 它们 的 标准 化 情 
况 。 

编写 应 用 程序 时 ， 另 一 个 需要 考虑 的 问题 是 目标 系统 安装 了 哪个 版 
本 的 函数 库 ， 它 使 用 的 选项 是 什么 ， 等 等 。 笠 运 的 是 ， 由 于 我 们 在 本 章 
中 所 看 到 的 标准 化 工作 ， 这 个 问题 已 经 显得 不 那么 明显 ， 但 它 仍 然 是 一 
个 比较 困难 的 问题 。 有 一 组 GNU 工 具 可 以 极 大 地 帮助 我 们 解决 这 一 问 
题 ， 它 们 是 autoconf 和 automake。 虽 然 你 可 能 不 会 直接 使 用 它们 ， 但 当 
通过 源 代 人 码 安装 软件 ， 在 命令 行 键 入 命令 ./configure;imake 时 ， 你 几乎 肯 
定 会 看 到 它们 带 来 的 好 处 。 

这 些 工 具 的 用 法 已 超出 了 本 书 介绍 的 范围 ， 但 你 可 以 通过 GNU 的 网 
站 http://www.gnu.org/software/autoconf 和 
http://www.gnu.org/software/automake 找 到 关于 它们 的 更 多 信息 。 


18.5 小结 


在 本 章 中 ， 我 们 简单 介绍 了 众多 UNIX 标 准 中 的 一 部 分 ， 它 们 帮助 
Linux 成 为 一 个 易于 编程 的 平台 ， 并 且 确 保 许 多 不 同 的 Linux 发 行 版 遵守 
一 些 基 本 的 标准 。 遵 守 标 准 可 以 让 编程 人 员 和 用 户 的 工作 变 得 更 加 轻 
松 ， 所 以 我 们 要 求 和 鼓励 读者 使 用 标准 。 
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时 至 今日 ，Linux 系 统 已 经 从 一 个 个 人 作品 发 展 为 可 以 用 于 各 种 关键 任务 的 成 熟 、 高 效 和 稳定 的 操作 系统 ， 
因为 具备 跨 平 台 、 开 源 、 支 持 众多 应 用 软件 和 网 络 协议 等 优点 ， 它 得 到 了 各 大 主流 软 硬 件 厂商 的 支持 ， 也 成 
为 广大 程序 设计 人 员 理 想 的 开发 平台 

本 书 是 Linux 程 序 设计 领域 的 经 典 名 著 ， 以 简单 易 懂 、 内 容 全 面 和 示例 丰富 而 广 受 好 评 。 中 文 版 前 两 版 出 
版 后 ， 在 国内 的 Linux 爱 好 者 和 程序 员 中 引起 了 强烈 反响 ， 这 一 热潮 一 直 持续 至 今 。 本 书 是 国内 读者 翘首 以 待 
的 第 4 版 ， 此 次 新 版 内 容 组 织 更 加 严谨 ， 译 者 更 是 细心 雕琢 ， 保 留 了 这 部 权威 著作 的 原 汁 原 昧 

对 Linux 所 提供 的 功能 全 面 而 准确 的 阐述 ， 以 及 贯穿 全 书 的 示例 程序 体验 ， 使 本 书 不 仅 成 为 初学 者 的 最 佳 
Linux 程 序 设计 指南 ， 而 且 是 中 高 级 程序 员 不 可 或 缺 的 参考 书 


Neil Matthew 和 Richard Stones 世界 知名 的 LinuxWUNIX 专 家 ， 有 数 十 年 Linux/UNIX 开 发 经 验 和 从 业经 历 。 他 们 使 
用 过 几乎 所 有 UNIX 版 本 ， 并 精通 C/C++、LISP、Fortran、Perl、Tcl 和 Prolog 等 各 种 语言 。 他 们 从 事 过 各 种 软件 项 目 ， 从 
实时 嵌入 式 系统 到 会 计 系统 和 零售 信息 系统 。 除 本 书 外 ， 他 们 还 合 著 过 PostgreSQL、MySQL 方 面 的 图 书 
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